Дали некогаш сте седеле таму и се чешате по главата, прашувајќи се… од каде всушност доаѓаат овие работи? Мислам, вештачката интелигенција не пребарува низ прашливи библиотеки ниту пак тајно гледа кратки видеа од YouTube. Сепак, некако таа извлекува одговори за сè - од трикови за лазањи до физика на црни дупки - како да има некаков кабинет за поднесување без дно внатре. Реалноста е почудна, а можеби и поинтригантна отколку што би претпоставиле. Ајде малку да го разоткриеме (и да, можеби да разбиеме неколку митови по патот).
Дали е тоа Магија? 🌐
Не е магија, иако понекогаш се чини така. Она што се случува под хаубата е во основа предвидување на шеми. Големите јазични модели (LLM) не ги складираат фактите на начинот на кој вашиот мозок го држи рецептот за колачиња на вашата баба; наместо тоа, тие се обучени да го погодат следниот збор (жетон) врз основа на она што се случило претходно [2]. Во пракса, тоа значи дека тие се држат до врските: кои зборови се дружат, како речениците обично се обликуваат, како цели идеи се градат како скеле. Затоа резултатот звучи правилно, иако - целосна искреност - тоа е статистичка имитација, а не разбирање [4].
Па што всушност ги прави информациите генерирани од вештачка интелигенција корисни? Неколку работи:
-
Разновидност на податоци - црпење од безброј извори, а не од еден тесен поток.
-
Ажурирања - без циклуси на освежување, брзо се застарува.
-
Филтрирање - идеално е да се фати ѓубрето пред да навлезе (иако, да бидеме реални, таа мрежа има дупки).
-
Вкрстена проверка - потпирање на авторитетни извори (на пример, НАСА, СЗО, големи универзитети), што е задолжително во повеќето прирачници за управување со вештачката интелигенција [3].
Сепак, понекогаш измислува - самоуверено. Оние таканаречени халуцинации? Всушност, дотерани глупости искажани со ригорозен израз на лицето [2][3].
Статии што можеби ќе ве интересираат по оваа:
🔗 Може ли вештачката интелигенција да ги предвиди броевите на лотаријата?
Истражување на митовите и фактите за предвидувањата на лотаријата со вештачка интелигенција.
🔗 Што значи да се има холистички пристап кон вештачката интелигенција
Разбирање на вештачката интелигенција со избалансирани перспективи за етиката и влијанието.
🔗 Што вели Библијата за вештачката интелигенција
Испитување на библиските перспективи за технологијата и создавањето на човекот.
Брза споредба: Од каде црпи вештачката интелигенција 📊
Не секој извор е еднаков, но секој си игра своја улога. Еве еден краток преглед.
| Тип на извор | Кој го користи (ВИ) | Цена/Вредност | Зошто функционира (или не функционира...) |
|---|---|---|---|
| Книги и статии | Големи јазични модели | Бесценето (приближно) | Густо, структурирано знаење - едноставно брзо старее. |
| Веб-страници и блогови | Речиси сите вештачки интелигенции | Бесплатно (со шум) | Дива разновидност; мешавина од брилијантност и апсолутно ѓубре. |
| Академски трудови | Вештачка интелигенција која е ориентирана кон истражувања | Понекогаш со платен ѕид | Ригор + кредибилитет, но напишани со тежок жаргон. |
| Кориснички податоци | Персонализирани вештачки интелигенции | Високо чувствително ⚠️ | Остро кроење, но изобилство главоболки поврзани со приватноста. |
| Веб во реално време | Вештачки интелигенции поврзани со пребарување | Бесплатно (доколку е онлајн) | Ги одржува информациите свежи; недостаток е ризикот од засилување на гласините. |
Универзумот на податоци за обука 🌌
Ова е фазата на „учење во детството“. Замислете му да му дадете на дете милиони книги со приказни, исечоци од вести и „зајачки дупки“ од Википедија одеднаш. Така изгледа претходната обука. Во реалниот свет, давателите на услуги спојуваат јавно достапни податоци, лиценцирани извори и текст генериран од обучувач [2].
Слоевито одозгора: курирани човечки примери - добри одговори, лоши одговори, поттурнувања во вистинската насока - пред дури и да започне засилувањето [1].
Предупредување за транспарентност: компаниите не ги откриваат сите детали. Некои заштитни огради се тајни (интелектуална сопственост, безбедносни прашања), така што добивате само делумен увид во вистинската мешавина [2].
Пребарување во реално време: Дополнителен додаток 🍒
Некои модели сега можат да ѕирнат надвор од нивниот меур за обука. Тоа е генерирање со подобрено пребарување (RAG) -во основа извлекување делови од индекс во живо или продавница за документи, а потоа нивно вплетување во одговорот [5]. Идеално за брзо менувачки работи како што се наслови на вести или цени на акции.
Проблемот? Интернетот е подеднакво гениј и ѓубре. Ако филтрите или проверките на потеклото се слаби, ризикувате враќање на несакана информација - токму она за што предупредуваат рамките за ризик [3].
Вообичаено решение: компаниите ги поврзуваат моделите со своите внатрешни бази на податоци, така што одговорите цитираат тековна политика за човечки ресурси или ажурирана документација за производот, наместо да се претеруваат. Размислете: помалку моменти на „ау-ау“, повеќе доверливи одговори.
Фино подесување: Чекор за полирање на вештачката интелигенција 🧪
Суровите претходно обучени модели се несмасни. Затоа се фино подесуваат:
-
Учејќи ги да бидат од помош, безопасни, чесни (преку учење со засилување од човечки повратни информации, RLHF) [1].
-
Шмирглање на небезбедни или токсични рабови (порамнување) [1].
-
Прилагодување на тонот - без разлика дали тој е пријателски, формален или игриво саркастичен.
Не станува збор толку за полирање на дијамант, колку за поттикнување статистичка лавина да се однесува повеќе како партнер за разговор.
Неуспесите и пречките 🚧
Да не се преправаме дека е беспрекорно:
-
Халуцинации - остри одговори кои се апсолутно погрешни [2][3].
-
Пристрасност - ги отсликува шемите вградени во податоците; дури може да ги засили ако не се провери [3][4].
-
Нема искуство од прва рака - може да зборува за рецепти за супи, но никогаш не пробал ниту еден [4].
-
Преголема самодоверба - прозата тече како да знае, дури и кога не знае. Рамките за ризик нагласуваат претпоставки за пореметување [3].
Зошто е како да знаеш 🧠
Нема верувања, нема меморија во човечка смисла и секако нема јас. Сепак, бидејќи ги спојува речениците непречено, вашиот мозок го чита како да разбира. Она што се случува е само предвидување на следниот знак во масовно ниво: анализа на трилиони веројатности во дел од секундата [2].
Вибрацијата на „интелигенција“ е евентуално однесување - истражувачите го нарекуваат, малку шеговито, ефект на „стохастички папагал“ [4].
Аналогија погодна за деца 🎨
Замислете папагал кој ги прочитал сите книги во библиотеката. Не разбира приказните, но може да ги преработи зборовите во нешто што звучи мудро. Понекогаш е совршено; понекогаш е бесмислено - но со доволно вештина, не можете секогаш да ја забележите разликата.
Заклучок: Од каде доаѓаат информациите за вештачката интелигенција 📌
Едноставно кажано:
-
Масивни податоци за обука (јавни + лиценцирани + генерирани од обучувачи) [2].
-
Фино подесување со човечки повратни информации за обликување на тонот/однесувањето [1].
-
Системи за пребарување кога се поврзани со текови на податоци во живо [5].
Вештачката интелигенција не „знае“ работи - таа го предвидува текстот. Тоа е и нејзина супермоќ и негова Ахилова пета. Заклучок? Секогаш проверувајте ги важните работи според доверлив извор [3].
Референци
-
Оујанг, Л. и др. (2022). Обука на јазични модели за следење на инструкции со човечка повратна информација (InstructGPT). arXiv.
-
OpenAI (2023). Технички извештај GPT-4 - мешавина од лиценцирани, јавни и човечки создадени податоци; цел и ограничувања за предвидување на следниот токен. arXiv.
-
NIST (2023). Рамка за управување со ризици од вештачка интелигенција (AI RMF 1.0) - потекло, доверливост и контрола на ризици. PDF.
-
Бендер, ЕМ, Гебру, Т., Мекмилан-Мејџор, А., Мичел, С. (2021). За опасностите од стохастичките папагали: Дали јазичните модели можат да бидат преголеми? PDF.
-
Луис, П. и др. (2020). Генерирање со зголемено пребарување за НЛП интензивно базирано на знаење. arXiv.