Што е тренер за вештачка интелигенција?

Вештачката интелигенција понекогаш се чувствува речиси како магичен трик. Внесувате случајно прашање и бам - за неколку секунди се појавува елегантен, дотеран одговор. Но, еве ја кривата топка: зад секоја „генијална“ машина, има вистински луѓе кои ја поттурнуваат, корегираат и обликуваат по патот. Тие луѓе се нарекуваат тренери за вештачка интелигенција , а работата што ја работат е почудна, посмешна и искрено почовечка отколку што повеќето луѓе претпоставуваат.

Ајде да разгледаме зошто овие тренери се важни, како всушност изгледа нивното секојдневие и зошто оваа улога расте побрзо отколку што кој било предвидуваше.

Статии што можеби ќе ве интересираат по оваа:

🔗 Што е арбитража со вештачка интелигенција: Вистината зад популарен збор
Објаснува арбитражата со вештачка интелигенција, нејзините ризици, придобивки и вообичаени заблуди.

🔗 Потребни услови за складирање на податоци за вештачка интелигенција: Што навистина треба да знаете
Ги опфаќа потребите за складирање, скалабилност и ефикасност за системи со вештачка интелигенција.

🔗 Кој е таткото на вештачката интелигенција?
Ги истражува пионерите на вештачката интелигенција и потеклото на вештачката интелигенција.

Што е тоа што прави еден тренер за вештачка интелигенција да биде солиден? 🏆

Не е работа на притискање копчиња. Најдобрите тренери се потпираат на прилично чудна мешавина од таленти:

Трпение (многу) - Моделите не учат одеднаш. Тренерите продолжуваат да ги повторуваат истите корекции сè додека не се зацврстат.
Забележување на нијанса - Забележувањето на сарказмот, културниот контекст или пристрасноста е она што им дава предност на човечките повратни информации [1].
Едноставна комуникација - Половина од работата е пишување јасни инструкции што вештачката интелигенција не може погрешно да ги прочита.
Љубопитност + етика - Добриот тренер се прашува дали одговорот е „фактички точен“, но социјално глув за тонот - главна тема во надзорот на вештачката интелигенција [2].

Едноставно кажано: тренерот е делумно наставник, делумно уредник и малку етичар.

Улоги на тренери за вештачка интелигенција на прв поглед (со некои необичности 😉)

Тип на улога	Кој најмногу одговара	Типична плата	Зошто функционира (или не)
Означувач на податоци	Луѓе кои ги сакаат фините детали	Ниско–средно $$	Апсолутно клучно; ако етикетите се нечисти, целиот модел страда [3] 📊
Специјалист за RLHF	Писатели, уредници, аналитичари	Средно–високо $$	Ги рангира и преработува одговорите за да го усогласи тонот и јасноста со човечките очекувања [1]
Тренер на домени	Адвокати, лекари, експерти	Низ целата мапа 💼	Се справува со нишен жаргон и рабни случаи за индустриски специфични системи
Рецензент за безбедност	Луѓе кои се етички настроени	Средно $$	Применува упатства за да се избегне штетна содржина од страна на вештачката интелигенција [2][5]
Креативен тренер	Уметници, раскажувачи	Непредвидливо 💡	Им помага на вештачката интелигенција да ја ехотира имагинацијата додека останува во безбедни граници [5]

(Да, форматирањето е малку неуредно - некако како самата работа.)

Еден ден од животот на тренер за вештачка интелигенција

Па, како изгледа вистинската работа? Замислете помалку гламурозно кодирање и повеќе:

Рангирање на одговори напишани од вештачка интелигенција од најлош до најдобар (класичен чекор на RLHF) [1].
Поправање на грешки (како кога моделот заборава дека Венера не е Марс).
Препишување на одговорите на четботот за да звучат поприродно.
Етикетирање планини од текст, слики или аудио - каде што точноста е навистина важна [3].
Дебата дали „технички исправно“ е доволно добро или дали безбедносните упатства треба да бидат надминати [2].

Делумно е макотрпно, делумно е загатка. Искрено, замислете да научите папагал не само да зборува, туку и да престане да користи зборови малку погрешно - тоа е атмосферата. 🦜

Зошто тренерите се многу поважни отколку што мислите

Без управување од страна на луѓето, вештачката интелигенција би:

Звучи круто и роботски.
Ширење на пристрасност неконтролирано (страшна мисла).
Тотално ми недостигаат хуморот или емпатијата.
Бидете помалку безбедни во чувствителни контексти.

Тренерките се оние кои се провлекуваат во „неуредните човечки работи“ - сленг, топлина, повремена несмасна метафора - а воедно поставуваат и заштитни огради за да ги заштитат работите [2][5].

Вештини што навистина се важни

Заборавете го митот дека ви е потребен докторат. Она што најмногу помага е:

Пишување + уредување - Дотеран, но природно звучен текст [1].
Аналитичко размислување - забележување на повторени грешки во моделот и нивно прилагодување.
Културна свест - Знаење кога фразирањето може да биде погрешно [2].
Трпеливост - Бидејќи вештачката интелигенција не се препознава веднаш.

Бонус поени за повеќејазични вештини или нишна експертиза.

Каде се појавуваат тренери 🌍

Оваа работа не е само за четботови - таа се провлекува во секој сектор:

Здравствена заштита - Правила за пишување анотации за гранични случаи (повторено во упатствата за здравствена вештачка интелигенција) [2].
Финансии - Обука на системи за откривање на измами без давење на луѓето во лажни аларми [2].
Малопродажба - Асистентите за предавање треба да го користат жаргонот на купувачите, а воедно да се држат до тонот на брендот [5].
Образование - Обликување на ботовите за подучување да бидат охрабрувачки, наместо покровителски [5].

Во основа: ако вештачката интелигенција има место на масата, во позадина се крие тренер.

Етичкиот дел (не може да се прескокне ова)

Тука е местото каде што станува важно. Доколку не се контролира, вештачката интелигенција ги повторува стереотипите, дезинформациите или уште полошо. Тренерите го спречуваат тоа со користење на методи како RLHF или уставни правила кои ги насочуваат моделите кон корисни, безопасни одговори [1][5].

Пример: ако бот дава пристрасни препораки за работа, тренерот го означува тоа, го преработува правилникот и се осигурува дека тоа нема да се случи повторно. Тоа е надзор во акција [2].

Не толку забавната страна

Не е сè баш најдобро. Тренерите се справуваат со:

Монотонија - Бесконечното етикетирање старее.
Емоционален замор - Прегледувањето на штетна или вознемирувачка содржина може да има последици; системите за поддршка се клучни [4].
Недостаток на препознавање - Корисниците ретко сфаќаат дека постојат тренери.
Постојана промена - Алатките се развиваат нон-стоп, што значи дека обучувачите мора да бидат во чекор.

Сепак, за многумина, возбудата од обликувањето на „мозоците“ на технологијата ги држи закачени.

Скриените MVP на вештачката интелигенција

Значи, кои се тренери за вештачка интелигенција? Тие се мостот помеѓу суровите алгоритми и системите што всушност функционираат за луѓето. Без нив, вештачката интелигенција би била како библиотека без библиотекари - тони информации, но речиси невозможни за користење.

Следниот пат кога четбот ќе ве насмее или ќе се почувствувате изненадувачки „во склад“, заблагодарете му се на тренер. Тие се тивките фигури што ги прават машините не само да пресметуваат, туку и да се поврзуваат [1][2][5].

Референци

[1] Оујанг, Л. и др. (2022). Обука на јазични модели за следење на инструкции со човечка повратна информација (InstructGPT). NeurIPS. Врска

[2] NIST (2023). Рамка за управување со ризици од вештачка интелигенција (AI RMF 1.0). Линк

[3] Норткат, К. и др. (2021). Сеприсутните грешки во етикетите во тест сетовите ги дестабилизираат референтните точки за машинско учење. NeurIPS податочни групи и референтни точки. Врска

[4] СЗО/МОТ (2022). Насоки за ментално здравје на работа. Линк

[5] Баи, Ј. и др. (2022). Конституционална вештачка интелигенција: Безопасност од повратни информации од вештачката интелигенција. arXiv. Линк

Пронајдете ја најновата вештачка интелигенција во официјалната продавница за асистенти за вештачка интелигенција

За нас

Назад кон блогот

Земја/регион