Dažreiz mākslīgais intelekts šķiet gandrīz kā burvju triks. Ievadi nejaušu jautājumu, un bam – dažu sekunžu laikā parādās eleganta, noslīpēta atbilde. Taču te nu ir aizkadra aizķeršanās: aiz katras “ģeniālās” mašīnas stāv īsti cilvēki, kas to procesa gaitā mudina, labo un veido. Šos cilvēkus sauc par mākslīgā intelekta treneriem , un viņu darbs ir dīvaināks, smieklīgāks un, patiesībā, cilvēcīgāks, nekā vairums cilvēku iedomājas.
Apskatīsim, kāpēc šie treneri ir svarīgi, kā patiesībā izskatās viņu ikdiena un kāpēc šī loma attīstās straujāk, nekā jebkurš prognozēja.
Raksti, kurus jūs varētu vēlēties izlasīt pēc šī raksta:
🔗 Kas ir mākslīgā intelekta arbitrāža: patiesība par šo modes vārdu
Izskaidro mākslīgā intelekta arbitrāžu, tās riskus, ieguvumus un izplatītos nepareizos priekšstatus.
🔗 Datu glabāšanas prasības mākslīgajam intelektam: Kas jums patiešām jāzina
Aptver mākslīgā intelekta sistēmu krātuves vajadzības, mērogojamību un efektivitāti.
🔗 Kas ir mākslīgā intelekta tēvs?
Pēta mākslīgā intelekta pionierus un tā pirmsākumus.
Kas raksturo labu mākslīgā intelekta treneri? 🏆
Tas nav pogu spiedziens. Labākie treneri balstās uz diezgan dīvainu talantu sajaukumu:
-
Pacietība (liela) — modeļi nemācās vienā piegājienā. Treneri turpina veikt vienus un tos pašus labojumus, līdz tie nostrādā.
-
Nianšu pamanīšana — sarkasma, kultūras konteksta vai aizspriedumu pamanīšana piešķir cilvēka atsauksmēm tās priekšrocības [1].
-
Vienkārša komunikācija — puse no darba ir skaidru instrukciju rakstīšana, kuras mākslīgais intelekts nevar pārprast.
-
Ziņkārība + ētika — labs treneris apšauba, vai atbilde ir “faktiski pareiza”, bet sociāli nedzirdīga — galvenā tēma mākslīgā intelekta uzraudzībā [2].
Vienkārši sakot: treneris ir daļēji skolotājs, daļēji redaktors un nedaudz ētikas speciālists.
Īss ieskats mākslīgā intelekta trenera lomās (ar dažām īpatnībām 😉)
| Lomas veids | Kurš vislabāk der | Tipiska alga | Kāpēc tas darbojas (vai nedarbojas) |
|---|---|---|---|
| Datu marķētājs | Cilvēki, kuriem patīk sīkas detaļas | Zema–vidēja $$ | Absolūti svarīgi; ja etiķetes ir neprecīzas, cieš viss modelis [3] 📊 |
| RLHF speciālists | Rakstnieki, redaktori, analītiķi | Vidēji augsts $$ | Sakārto un pārraksta atbildes, lai toni un skaidrību saskaņotu ar cilvēku gaidām [1] |
| Domēna treneris | Advokāti, ārsti, eksperti | Visā kartē 💼 | Nodarbojas ar nišas žargonu un specifiskiem gadījumiem nozarēm specifiskām sistēmām |
| Drošības recenzents | Ētiski domājoši cilvēki | Vidējs $$$ | Piemēro vadlīnijas, lai mākslīgais intelekts izvairītos no kaitīga satura [2][5] |
| Radošais treneris | Mākslinieki, stāstnieki | Neparedzams 💡 | Palīdz mākslīgajam intelektam atspoguļot iztēli, vienlaikus ievērojot drošās robežas [5]. |
(Jā, formatējums ir nedaudz nekārtīgs — līdzīgi kā pats darbs.)
Diena mākslīgā intelekta trenera dzīvē
Tātad, kā izskatās faktiskais darbs? Iedomājieties mazāk glaunu kodēšanu un vairāk:
-
Mākslīgā intelekta rakstīto atbilžu sakārtošana no sliktākās uz labāko (klasiskais RLHF solis) [1].
-
Neskaidrību labošana (piemēram, kad modelis aizmirst, ka Venera nav Marss).
-
Čatbota atbilžu pārrakstīšana, lai tās izklausītos dabiskāk.
-
Teksta, attēlu vai audio kalnu marķēšana — vieta, kur precizitāte patiešām ir svarīga [3].
-
Diskusijas par to, vai “tehniski pareizi” ir pietiekami labi, vai arī drošības vadlīnijām vajadzētu būt svarīgākām [2].
Tā ir daļēji sarežģīta, daļēji mīklaina nodarbe. Godīgi sakot, iedomājieties, ka mācāt papagaili ne tikai runāt, bet arī pārtraukt lietot vārdus nedaudz nepareizi – tāda ir atmosfēra. 🦜
Kāpēc treneri ir daudz svarīgāki, nekā jūs domājat
Bez cilvēka stūrēšanas mākslīgais intelekts (MI) varētu:
-
Skaņa stīva un robotiska.
-
Nekontrolēta aizspriedumu izplatīšana (biedējoša doma).
-
Pilnīgi pietrūkst humora vai empātijas.
-
Esiet mazāk drošs jutīgos kontekstos.
Treneri ir tie, kas ielauj “nekārtīgās cilvēciskās lietas” – slengu, sirsnību, reizēm neveiklas metaforas –, vienlaikus arī uzliekot drošības barjeras [2][5].
Prasmes, kas patiesībā ir svarīgas
Aizmirstiet mītu, ka jums ir nepieciešams doktora grāds. Visvairāk palīdz:
-
Rakstīšanas + rediģēšanas nianses — noslīpēts, bet dabiski skanošs teksts [1].
-
Analītiskā domāšana — atkārtotu modeļa kļūdu pamanīšana un pielāgošana.
-
Kultūras izpratne — izpratne par to, kad frāze varētu būt nepareiza [2].
-
Pacietība — jo mākslīgais intelekts neuztver visu uzreiz.
Bonusa punkti par daudzvalodu prasmēm vai nišas zināšanām.
Kur ierodas treneri 🌍
Šis darbs nav tikai par tērzēšanas robotiem — tas ienāk ikvienā nozarē:
-
Veselības aprūpe — robežgadījumu anotāciju rakstīšanas noteikumi (atspoguļoti veselības aprūpes mākslīgā intelekta vadlīnijās) [2].
-
Finanses — krāpšanas atklāšanas sistēmu apmācība, neapdraudot cilvēkus ar viltus trauksmēm [2].
-
Mazumtirdzniecība — asistentu apmācība, lai apgūtu pircējiem raksturīgo žargonu, vienlaikus ievērojot zīmola toni [5].
-
Izglītība — apmācību robotprogrammatūras veidošana, lai tās būtu iedrošinošas, nevis augstprātīgas [5].
Būtībā: ja mākslīgajam intelektam ir vieta pie galda, fonā slēpjas treneris.
Ētikas daļa (to nevar izlaist)
Te nu tas kļūst svarīgi. Ja mākslīgais intelekts netiek kontrolēts, tas atkārto stereotipus, dezinformāciju vai vēl ļaunāku lietu. Treneri to aptur, izmantojot tādas metodes kā RLHF vai konstitucionālus noteikumus, kas virza modeļus uz noderīgām, nekaitīgām atbildēm [1][5].
Piemērs: ja bots izsaka neobjektīvus darba ieteikumus, treneris to atzīmē, pārraksta noteikumu kopumu un nodrošina, ka tas vairs neatkārtosies. Tā ir uzraudzība darbībā [2].
Ne tik jautrā puse
Ne viss ir tik gludi. Treneri risina šādas problēmas:
-
Monotonija — bezgalīga etiķešu likšana apnīk.
-
Emocionāls nogurums — kaitīga vai satraucoša satura pārskatīšana var atstāt iespaidu uz sevi; atbalsta sistēmas ir ļoti svarīgas [4].
-
Atpazīstamības trūkums — lietotāji reti apzinās, ka pastāv pasniedzēji.
-
Pastāvīgas pārmaiņas — rīki nepārtraukti attīstās, kas nozīmē, ka treneriem ir jāspēj sekot līdzi.
Tomēr daudziem aizrautība par tehnoloģiju “smadzeņu” veidošanu notur aizrautību.
Mākslīgā intelekta slēptie MVP
Tātad, kas ir mākslīgā intelekta treneri? Viņi ir tilts starp neapstrādātiem algoritmiem un sistēmām, kas faktiski strādā cilvēku labā. Bez viņiem mākslīgais intelekts būtu kā bibliotēka bez bibliotekāriem — milzum daudz informācijas, bet gandrīz neiespējami to izmantot.
Nākamreiz, kad tērzēšanas robots liek jums smieties vai pārsteidzoši “saskaņojas”, pateicieties trenerim. Tās ir klusās figūras, kas liek mašīnām ne tikai aprēķināt, bet arī izveidot savienojumu [1][2][5].
Atsauces
[1] Ouyang, L. et al. (2022). Valodu modeļu apmācība instrukciju izpildei ar cilvēka atgriezenisko saiti (InstructGPT). NeurIPS. Saite
[2] NIST (2023). Mākslīgā intelekta riska pārvaldības sistēma (AI RMF 1.0). Saite
[3] Northcutt, C. et al. (2021). Izplatītas etiķešu kļūdas testa kopās destabilizē mašīnmācīšanās kritērijus. NeurIPS datu kopas un kritēriji. Saite
[4] PVO/SDO (2022). Vadlīnijas par garīgo veselību darbā. Saite
[5] Bai, Y. et al. (2022). Konstitucionālais mākslīgais intelekts: nekaitīgums no mākslīgā intelekta atgriezeniskās saites. arXiv. Saite