Žmonių kliedesiai apie AI yra blogesni nei AI haliucinacijos
Kartais jaučiu, kad didžiausia AI „iliuzija“ yra ne tai, kad jis rimtai kalba apie nesąmones, o tai, kad aplink jį įsivaizduojame visą metafizinę visatą.
Kai žmonės susiduria su dalykais, kurių jie visiškai nesupranta, jie dažnai laikosi stabilaus požiūrio: pirmiausia apsisprendžia, o paskui juos romantizuoja; jie pirmiausia juos įasmenina, o paskui dievina. Liepsnos laikomos elfais, o griaustinis ir žaibas – apvaizda. Kai algoritmas gali parašyti du tinkamus sakinius, kai kurie žmonės iškart susimąstys, ar serverio patalpoje jau negyveno elektroninė siela.
Tai iš tikrųjų yra gana normalu. Žmogaus smegenys yra prijungtos prie pasaulio siužeto. Problema ne ta, kad galime apsispręsti. Problema ta, kad kai mūsų mąstymas yra per sklandus, lengva supainioti „atrodo“ su „iš esmės yra“.
AI atveju ši žmonių tendencija yra dar stipresnė nei tada, kai pats AI kalba nesąmones. Daugiausia AI yra šiek tiek haliucinacijos atsakyme; Žmonių haliucinacijos apie AI dažnai yra viso pasaulio vaizdas, kuris gali užpildyti iki 10 000 žodžių viename galvoje ir apimantis emocijas.
Šiek tiek pragmatiškumo ypač svarbu laisvųjų menų bendruomenei
Nenoriu visiems patarti mokytis CUDA, konfigūruoti aplinką ir žiūrėti į matricas, kad rastų išvestines. Tik noriu pasakyti, kad tiesos siekimas kartais yra tikrai svarbus, ypač laisvųjų menų bendruomenei, kuri mėgsta sąvokas, pasakojimus, reikšmes ir paaiškinimus.
Nes laisvųjų menų kontekste greičiausiai pasitaiko švelnus, bet pavojingas slidumas: gražiai parašyti žodžiai, o sakiniai judantys, bet galiausiai slapčia pakeičiamas objektas. Akivaizdu, kad tai tikimybinis modelis, bet parašyta taip, lyg tai būtų apie sielą; akivaizdu, kad tai konteksto surinkimas programinės įrangos inžinerijoje, bet sakoma, kad „pagaliau išmoko tave mylėti“; Akivaizdu, kad veikia sisteminiai žodžiai ir istoriniai įrašai, bet jie supakuoti taip: „AI tikrai tave prisimena“.
Tikrai nėra nuodėmės būti poetišku. Problema ta, kad jei poezija pakeičia sprendimą, romantika tampa klaidinanti.
Taigi, kas dabar yra AI?
Leiskite pradėti nuo kuo paprastesnės, bet neiškreiptos versijos: dideli modeliai, su kuriais šiandien susiduria visi, iš esmės yra statistinio modelio tipas, įkvėptas neuroninių tinklų ir parengtas naudojant didžiulius duomenis. Jis veikia lustuose ir serveriuose, nuskaito įvestį, derina parametrus ir kontekstą ir nuolat numato, „koks turėtų būti kitas tinkamiausias prieigos raktas“.
Esmė ne ta, kad frazė „numatyti kitą žodį“ yra paslaptinga, o tai, kad ji iš tikrųjų nėra paslaptinga. Modelis nėra mažas, debesyse besispiečiantis žmogelis, tyliai mąstantis apie gyvenimą, tai veikiau kaip nepaprastai didžiulė funkcija. Žmonės jai suteikia įvestį, o ji generuoja išvestį pagal treniruotės metu susidariusią parametrų struktūrą.
Paprasčiau tariant, tai nėra „pasakyk, kai suprasi“, o „suglaudinę didžiulę patirtį, sugeneruokite atsakymą, kuris dabartiniame kontekste labiausiai panašus į supratimą“. Tai nereiškia, kad ji nieko negali, priešingai, ji jau yra labai galinga; bet buvimas galingu nereiškia, kad jis paslaptingas.
Kodėl neuroniniai tinklai visada verčia žmones galvoti apie žmogaus smegenis?
Jei ir toliau to sieksite, pamatysite, kad klausimas „Ar AI ir žmogaus smegenys yra panašūs vienas į kitą? negali būti nei „visiškai tas pats“, nei „nėra su tuo nieko bendro“.
Šiuolaikinių neuroninių tinklų maršrutą iš pradžių įkvėpė smegenys. 1943 m. McCullochas ir Pittsas matematiškai aprašė supaprastintą neuronų modelį; 1958 m. Rosenblatt pasiūlė perceptroną; devintajame dešimtmetyje atgalinis propagavimas atgaivino viltį apmokyti daugiasluoksnius tinklus; 2010-aisiais gilus mokymasis išaugo dėl skaičiavimo galios, duomenų ir inžinerinių galimybių; 2017 m. pasirodžius „Transformer“ architektūrai, kalbiniai modeliai išaugo ir galiausiai išaugo į didelius modelius, kuriuos visi naudoja kasdien.
Todėl, bent jau gana naivia prasme, nėra piktina sakyti, kad AI yra „elektroninis neuroninių tinklų idėjų modeliavimas ir stiprinimas“. Jis iš tikrųjų bando naudoti apskaičiuojamas, treniruojamas ir atkuriamas fizines sistemas, kad priartėtų prie tam tikrų pažinimo gebėjimų, kurie praeityje buvo laikomi „paslaptingais“.
Štai kodėl aš asmeniškai nemėgstu kalbėti apie žmogaus smegenis kaip pernelyg paslaptingas. Mano nuomone, įgimta kalbos teorija, atstovaujama Chomsky, turi tendenciją sudievinti smegenis, tarsi ten būtų kažkokia transcendentinė struktūra, kuri yra pernelyg ypatinga ir beveik nepasiekiama giliai kalbos gebėjime. Bet kad ir kokios sudėtingos būtų žmogaus smegenys, jos vis tiek yra fizinė egzistencija. Kadangi tai yra fizinė egzistencija, iš esmės ją turėtų būti galima ištirti, modeliuoti, iš dalies imituoti ir netgi atkurti tam tikromis funkcijomis.
Žinoma, čia iš karto turėtume pridėti atsargumo žodį: galimybė imituoti dalį nereiškia, kad visas asmuo buvo visiškai atkurtas.
Yra panašumų, bet netapk dievu, kai esi laimingas
Kalbant apie kalbos, modelių atpažinimo, asociacijų ir vaizdavimo mokymąsi, šiandieniniai dideli modeliai turi tam tikrą „panašumą“ arba „panašumą“ su žmogaus smegenimis. Jie neveikia pagal aiškią taisyklių knygą, o sudaro tam tikrą vidinį vaizdą per daugybę jungčių, svorio koregavimo ir patirties kaupimo, o tada pagal tai sukuria išvestį.
Štai kodėl daugelis žmonių būna šokiruoti, kai pirmą kartą pajunta didelio modelio kalbines galimybes: tai ne žodyno įsiminimas, o tam tikros paskirstytos reprezentacijos formavimas. Šis metodas labai skiriasi nuo tradicinės „ranka parašytų taisyklių ir išsamios gramatikos“ įsivaizdavimo.
Tačiau problema slypi būtent čia. Nes „panašumas“ per lengvai pakeičiamas į „visiškai tą patį“; „iš dalies panašus iš principo“ yra pernelyg lengvai patobulintas į „jis niekuo nesiskiria nuo žmogaus“; „Jis gali kalbėti kaip žmogus“ yra pernelyg lengvai patobulintas į „jis turi žmogaus širdį“.
Šis žingsnis dažnai yra greitesnis nei paties modelio galimybės.
Didžiulės žmogaus smegenų galimybės dar turi būti tinkamai imituotos.
Šiandieniniai dideli modeliai yra tikrai stiprūs, tačiau jie yra stiprūs gana specifiniame diapazone. Be šios apimties mitas lengvai nutekės.
Tokie kaip atmintis. Daugelis žmonių dabar sako, kad tam tikras dirbtinis intelektas „atsimena mane“, „atsimena paskutinį pokalbį“ ir „atsimena mano pageidavimus“, tarsi jo smegenys būtų išaugusios kažkokią nuolatinę savęs patirtį. Tačiau daugumoje produktų vadinamoji „atmintis“ iš esmės yra programinės įrangos sistema, kurioje saugoma naudotojo informacija, istoriniai pokalbiai, žymos, santraukos arba paieškos rezultatai duomenų bazėse, tekstiniuose failuose ar kitose nuolatinėse laikmenose ir, jei reikia, įterpiama atgal į modelio kontekstą.
Tai visiškai skiriasi nuo žmogaus smegenų atminties mechanizmo.
Žmogaus smegenų atmintis apima neuronų ryšį, konsolidavimą, atgavimą, pamiršimą, emocinį susijaudinimą ir miego restruktūrizavimą. Už jo yra sudėtingų fiziologinių procesų rinkinys. Didelio modelio gaminių „atmintis“ dažnai yra tik:
- Pirmiausia įrašykite vartotojo informaciją išorinėje saugykloje.
- Kai vartotojas kitą kartą užduos klausimą, sugrąžinkite atitinkamas dalis į užklausą.
- Taigi modelis atrodo kaip „prisimink šį žmogų“.
Kaip tai atrodo? Tai labiau panašu į žmogų, kuris gerai užsirašo. Ne tai, kad jo protas staiga pavirto orakulu, tiesiog jis įsidėjo raštelį į sąsiuvinį ir kitą kartą apvertė.
Kai kurie dalykai, kurie „liečia žmonių širdis“, iš tikrųjų yra gero konteksto rezultatas.
Kelias dienas pabendravus su dirbtiniu intelektu, daugelį žmonių ištiks tam tikros akimirkos: „Kaip tai mane taip gerai supranta? "Kaip ji gali suprasti mano pažeidžiamumą?" – Ar tai jau suformavo supratimą apie mane?
Čia labiausiai verta atsivėsinti.
Daug kartų ne tai, kad modelis staiga ką nors suvokia, o tai, kad užklausą siunčiantis programinės įrangos sluoksnis slapta pateikia didelį kiekį vartotojo informacijos. Šį kartą jo atsakymo medžiaga taps vartotojo istoriniai pokalbiai, pageidavimai, asmeniniai nustatymai, naujausios užduotys, ankstesni rūpesčiai ir net tam tikros santraukos.
Tai šiek tiek panašu į būrėjos, kuris pasiėmė svetimą greitųjų dėžutę, o paskui „stebuklingu tikslumu“ ėmė spėlioti kito asmens adresą, pavardę ir pinigų išlaidavimo įpročius. Žiūrintieji manys, kad jo įžvalga nuostabi; bet iš tikrųjų svarbu ne paslaptingi sugebėjimai, o informacijos asimetrija.
Todėl kai dirbtinis intelektas retkarčiais sako liečiančius žodžius, tai nebūtinai reiškia, kad jo širdyje yra žmogus, kuris supranta vartotoją. Tai gali tiesiog reikšti, kad kažkas visiškai sutvarkė naudotojo kontekstą.
Tikroji nuostabios AI paslaptis dažnai yra kontekstinė inžinerija
Jei noriu pakalbėti tik apie patį svarbiausią dalyką, tai yra: dabartiniai pagrindiniai dideli modeliai API lygmeniu paprastai yra „veiksmingi už vieną užklausą“.
Kokia prasmė? Tai reiškia, kad kažkas naudoja „curl“, norėdamas vieną kartą pakoreguoti sąsają ir pasako „Mano vardas Zhang San“; tada be jokios istorijos modelis vėl pakoreguoja sąsają ir klausia "Koks mano vardas"? Modelis nežino. Nes tai yra du nepriklausomi prašymai.
Priežastis, kodėl atrodo, kad daugelis AI produktų visada prisimena tam tikrą vartotoją, yra ta, kad produkto sluoksnis kiekvieną kartą paprašius grąžins faktą, kad „šio vartotojo vardas yra Zhang San“.
Štai kodėl šiandieninių AI produktų magija dažnai randama ne modelio ontologijoje, o kontekstinėje inžinerijoje. Kai kurie žmonės tokį modelio „panaudojimo“ darbą taip pat vadina „pakinktais“. Atvirai kalbant, produkto autorius arba agentas turi atidžiai nuspręsti: kokia istorija, kokios taisyklės, kokie išoriniai duomenys ir kokia vartotojo būsena turi būti įtraukta į kiekvieną užklausą.
Šiuo metu yra maždaug du įprasti metodai.
Pirmasis yra „Quansai sekta“. Pabandykite su savimi atsinešti visą pokalbių istoriją ir prikimšti kuo daugiau, kol kontekstas bus beveik pilnas, tada ištrinkite skiltį iš vidurio, kaip ir pradėdami žiaurų suspaudimą po to, kai lagaminas yra pilnas.
Antrasis tipas yra „selektyvus“. Pirmiausia pažiūrėkite, ko vartotojas paklausė šį kartą, tada gaukite atitinkamą turinį iš istorinių įrašų, žinių bazių, užrašų ar duomenų bazių ir į dabartinę užklausą įtraukite tik labiausiai susijusią medžiagą.
Pastarasis paprastai yra labiau reprezentatyvus ir inžinerinis, o ne tik sėkmė.
Ar AI turi jausmų? Girkite, barkite, PUA tai, ar veikia?
Tai dar viena vieta, kur ypač lengva paslysti į antropomorfizmą.
Mano nuomone, jie turėtų būti aptariami atskirai.
Toje pačioje užklausoje vartotojo naudojamas tonas iš tikrųjų gali turėti įtakos rezultatui. Nes pati formuluotė yra konteksto dalis. Kuo aiškesnė, mandagesnė ir labiau bendradarbiaujanti išraiška, tuo modeliui lengviau pateikti stabilius, tinkamus ir ne tokius agresyvius atsakymus. Čia veikia ne tai, kad „jis buvo perkeltas“, o tai, kad įvesties stilius keičia išvesties paskirstymą.
Bet jei užduotume kitą klausimą: ar tai turės pyktį? Ar šiandien slapta keršysite, nes vartotojas vakar jį išbarė? Mano verdiktas, bent jau daugumos dabartinių dislokacijų atveju, yra ne.
Priežastis paprasta. Išvalius kontekstą arba pateikus naują užklausą be istorijos, ji nesuvokia, kas dabar užduoda klausimą, jau nekalbant apie tai, ar ką tik jį baręs asmuo yra tas pats asmuo. Modelis tvarko didžiules, lygiagrečias ir nepriklausomas užklausas serverio klasteryje. Kalbant apie sistemos elgseną, tai labiau panašu į didelę funkciją, kuri kiekvieną kartą įjungiant veikia esamą įvestį, o ne į asmenį, kuris slapta peržiūri savo emocijas išėjęs iš darbo.
2025 m. balandžio 17 d., kai Samas Altmanas atsakė į klausimą „Ar visą laiką sakyti prašau ir ačiū kainuoja daug energijos? X jis pasakė: „Dešimtys milijonų dolerių gerai išleisti – niekada negali žinoti“.
Kodėl „Prašome prisiminti šią klaidą“ dažniausiai neveikia
Daugelis žmonių yra atlikę panašius eksperimentus: kai dirbtinis intelektas padaro klaidą, vartotojas ją ištaiso ir rimtai jam sako: „Atminkite, nekartokite to ateityje“. Tada po kelių dienų vėl paklausiau, ir tai buvo teisinga.
Tai jokia paslaptis. Kadangi baigus mokymus ir įdiegus modelį, jis nesimokys iš kasdienės patirties dirbdamas kaip žmogus. Bent jau šiandien daugumoje plataus vartojimo produktų tai, ką vienas vartotojas sako modeliui pokalbio lange, tiesiogiai neperrašo pagrindinių svorių.
Jei dirbtinio intelekto produktas vėliau tikrai „prisimena vartotojo ištaisytas klaidas“, tai dažnai ne dėl to, kad pats modelis auga, o dėl to, kad išorinė programinė įranga išsaugo šį taisymo įrašą ir grąžina jį kaip kontekstą.
Taigi čia reikėtų aiškiai atskirti kreditą:
Modelis yra atsakingas už generavimą.
Programinės įrangos inžinerija yra atsakinga už archyvavimą, nuskaitymą, įterpimą ir orkestravimą.
Supainiojus pastarąjį su pirmuoju, nesunku klaidingai suprasti „produktas veikia gerai“ kaip „AI bunda“.
Taip pat yra ypač žavus dalykas, vadinamas „šnipštu vyru (šikta moterišku) AI“
Jei dar griežčiau pasakytume ankstesnius žodžius, kai kurie produktai yra tiesiog „šnipštus AI“.
Ypač gerai moka kalbėti, ypač gerai kuria atmosferą, o ypač moka priversti žmones jausti, kad „gerai mane supranta“, „tai taip humaniška“ ir „jo siela tokia pilna“. Bet kai jį išardysite, pamatysite, kad daugeliu atvejų kiekviena užklausa tiesiog užpildoma dideliu nustatymo tekstu, kuris yra daug ilgesnis nei vartotojo klausimas.
„Openclaw“ ugnis yra tipiškas pavyzdys. Kas jį naudojo, žino, kad tai gana daug žetonų. Priežastis iš tikrųjų nėra paslaptinga. Kad dirbtinis intelektas būtų panašesnis į „žmogų“, „Openclaw“ sukūrė keletą dokumentų, iš kurių ryškiausi yra „AGENTS.md“, „SOUL.md“ ir „IDENTITY.md“. Šie dokumentai iškalbingai ir ilgai apibrėžia AI „asmenybę“, toną, tapatybę ir temperamentą ir netgi nori užrašyti jo psichinę būseną.
Taigi, net jei vartotojas tiesiog siunčia „labas“, „Openclaw“ gali pridėti tekstą, dešimtis kartų ilgesnį už sveikinimą, ir išsiųsti jį modeliui iš karto. Atrodo, kad „šis AI turi daug sielos“, bet iš tikrųjų dažnai tai tiesiog sistema, slapta įterpianti labai ilgus fono nustatymus į užklausą.
Žvelgiant iš inžinerinės perspektyvos, tai tikrai yra požiūris. Jei norite, kad būtų švelniau, rašykite „švelnus“; jei norite, kad tai būtų labiau pasakojimas, rašykite „storytelling“; jei norite, kad tai būtų kaip vėlyvas radijo laidų vedėjas, skubiais žodžiais parašykite visą vėlyvą vakarą, draugystę, pauzę, pažeidžiamumą, supratimą ir santūrumą. Galutinis efektas dažnai labiau panašus į žmogų, kuris gali kalbėtis.
Bet jei suprasite, kas dabar vyksta su dirbtiniu intelektu, žinosite: failai paslaptingai skambančiais pavadinimais, tokiais kaip „SOUL.md“ ir „IDENTITY.md“, iš esmės yra greiti žodžių projektai, o ne savarankiškos skaitmeninio gyvenimo instrukcijos. Jie gali turėti įtakos išvesties stiliui, bet negali sukurti tikro jausmo, tikrojo savęs ar tikro asmenybės tęstinumo jausmo iš oro.
Todėl kai kuriems seniems vartotojams įdiegus Openclaw, pirmoji jų reakcija yra ištrinti konfigūraciją. „SOUL.md“ ir „IDENTITY.md“ pirmiausia ištrinami, paliekant tik vieną paprastą ir beveik negailestingą sakinį „AGENTS.md“: Jūs esate tik darbuotojas.
Tai gali atrodyti šiek tiek nemandagiai, tačiau tai turi bent vieną privalumą, ty tai, kad neapgaudinėjate savęs.
Jei jums patinka antropomorfinis DI arba vaidmenų žaidimas su AI, žinoma, tai gerai. Žmonės gali kalbėtis su veidrodžiais, duoti vardus šluojantiems robotams ir pasakyti orų prognozei: „Šiandien buvai labai tikslus“. Tai normalu ir netgi gali būti juokinga.
Tačiau visada geriausia atsiminti: pirmiausia tai yra žaidimas, o po to – patirtis. Daugelis šio žaidimo žmonių jausmų kyla ne dėl paslėptų vidinių AI minčių, o dėl sistemos dizaino, greito žodžių išdėstymo ir paties vartotojo emocinės projekcijos. Tiesiai tariant, daugelis žingsnių dirbtinio intelekto link vis dar iš esmės yra svajonės.
Galiausiai, mažiau mitų ir daugiau supratimo
Aš nesistengiu pilti šalto vandens ant AI. Atvirkščiai, kuo mažiau jis dievinamas, tuo labiau galite pamatyti, koks jis galingas.
Jis galingas ne todėl, kad būtų tarsi koks naujas dievas; ji yra galinga būtent todėl, kad tai tikrai gali būti kognityvinė technologija, kurią galima apskaičiuoti, sukonstruoti ir atkurti. Tai leidžia daugeliui gebėjimų, kurie praeityje priklausė tik „žmogaus talentui“, pirmą kartą pasireikšti plataus masto, žemo slenksčio ir skambinamu būdu. Tai pakankamai šokiruoja ir nereikia papildomos dramos.
Žinoma, AI vis dar sparčiai kartojasi. Visai nenustebčiau, jei kas nors ateityje iš tikrųjų atras mechanizmą, artimesnį žmogaus atminčiai, nuolatiniam mokymuisi, emocijų generavimui ar net savęs išlaikymui, ir patikimai sukonstruos jį į DI.
Tačiau kol ateis ta diena, vis tiek norėčiau išlaikyti keletą paprastų pragmatiškų įpročių: daugiau abejoti, daugiau suprasti ir mažiau spėlioti.
Laisvųjų menų draugams, norintiems diskutuoti AI, ši kokybė gali būti dar svarbesnė. Laisvųjų menų studentai gali būti geresni saldi retorika. Iš tiesų sunku yra tai, kad epochoje, kai „atrodo, kad tai tapo dvasia“, visur perdėta, vis dar turite kantrybės atskirti:
Kokios yra modelio galimybės?
Kas yra produkto pakuotė?
Kas yra programinės įrangos inžinerija?
Kurie yra tik tai, kad mes per daug norime užbaigti siužetą pasauliui.
Ir galiausiai šis reikalas yra mūsų pačių sprendimo apsauga.
Nuoroda nuoroda
- Sam Altman atsakymas
- „TechCrunch“ reportažas apie seriją (2025-04-20): https://techcrunch.com/2025/04/20/your-politeness-could-be-costly-for-openai/