Inimeste luulud tehisintellekti kohta on hullemad kui tehisintellekti hallutsinatsioonid
Mõnikord tunnen, et tehisintellekti suurim "illusioon" pole mitte see, et ta räägib tõsiselt lollusi, vaid see, et me oleme selle ümber kujutanud tervet metafüüsilist universumit.
Kui inimesed seisavad silmitsi asjadega, millest nad päris aru ei saa, on neil sageli stabiilne lähenemine: nad teevad esmalt otsuse ja seejärel romantiseerivad; nad esmalt isikustavad neid ja siis jumaldavad neid. Leeke peetakse päkapikkudeks ning äikest ja välku peetakse ettenägelikkuseks. Kui algoritm suudab kirjutada kaks korralikku lauset, tekib mõnel inimesel kohe küsimus, kas serveriruumis on elektrooniline hing juba elanud.
See on tegelikult täiesti normaalne. Inimese aju on ühendatud maailma süžee lisamiseks. Probleem ei ole selles, et me suudame oma otsuseid teha. Probleem on selles, et kui meie mõtlemine on liiga sujuv, on lihtne segi ajada "näeb välja" ja "põhimõtteliselt on".
AI puhul on see inimeste kalduvus isegi tugevam kui siis, kui tehisintellekt ise räägib lolli juttu. Maksimaalselt on AI vastuses väike hallutsinatsioon; Inimeste hallutsinatsioonid tehisintellekti kohta on sageli terve maailmavaade, mis võib ühes mõttes täita kuni 10 000 sõna ja sisaldab ka emotsioone.
Natuke pragmatismi on eriti oluline vabade kunstide kogukonna jaoks
Ma ei taha soovitada kõigil õppida CUDAt, konfigureerida keskkonda ja vaadata tuletisi leidmiseks maatrikseid. Tahan lihtsalt öelda, et tõe otsimine on mõnikord tõesti oluline, eriti vabade kunstide kogukonna jaoks, kes armastab mõisteid, narratiive, tähendusi ja seletusi.
Sest vabade kunstide kontekstis võib kõige tõenäolisemalt tekkida õrn, kuid ohtlik libe: sõnad on ilusti kirjutatud ja laused liigutavad, kuid lõpuks muudetakse objekti salaja. Ilmselgelt on see tõenäosuslik mudel, kuid see on kirjutatud nii, nagu oleks see hingest; see on ilmselgelt tarkvaratehnika konteksti kokkupanemine, kuid öeldakse nagu "lõpuks õppis see sind armastama"; Ilmselgelt töötavad süsteemsed sõnad ja ajaloolised kirjed, kuid see on pakendatud kujul "AI tõesti mäletab sind."
Kindlasti pole patt poeetiline olla. Probleem on selles, et kui luule asendab hinnanguid, muutub romantika eksitavaks.
Niisiis, mis täpselt on AI nüüd?
Lubage mul alustada versiooniga, mis on võimalikult lihtne, kuid mitte moonutatud: suured mudelid, millega kõik tänapäeval kokku puutuvad, on oma olemuselt teatud tüüpi statistilised mudelid, mis on inspireeritud närvivõrkudest ja treenitud tohutute andmete kaudu. See töötab kiipides ja serverites, loeb sisendit, kombineerib parameetreid ja konteksti ning ennustab pidevalt, "mis peaks olema järgmine kõige sobivam token".
Asi pole siin selles, et fraas "ennustage järgmist sõna" on salapärane, vaid selles, et see pole tegelikult üldse salapärane. Modell ei ole vaikselt elu üle mõtisklev väike inimene pilvede vahel, pigem on tegemist ülisuure funktsiooniga. Inimesed annavad sellele sisendi ja see genereerib väljundi vastavalt treeningu käigus moodustunud parameetristruktuurile.
Kui seda asja maalähedasemalt väljendada: see ei ole "öelge seda pärast aru saamist", vaid "pärast tohutu hulga kogemuste kokkusurumist genereerige vastus, mis on praeguses kontekstis kõige sarnasem mõistmisele". See ei tähenda, et ta ei saaks midagi teha, vastupidi, see on juba väga võimas; kuid võimas olemine ei tähenda, et see oleks salapärane.
Miks panevad närvivõrgud inimesi alati mõtlema inimajule?
Kui jätkate sellega tegelemist, avastate, et küsimus "Kas tehisintellekt ja inimese ajud sarnanevad üksteisega?" ei saa öelda, et see on "täpselt sama" ega "ei ole sellega midagi pistmist".
Kaasaegsete närvivõrkude marsruut oli algselt inspireeritud ajust. 1943. aastal kirjeldasid McCulloch ja Pitts matemaatiliselt lihtsustatud neuronimudelit; 1958. aastal pakkus Rosenblatt välja perceptroni; 1980. aastatel sütitas tagasilevi taas lootuse koolitada mitmekihilisi võrgustikke; 2010. aastatel kasvas süvaõpe koos arvutusvõimsuse, andmete ja tehniliste võimalustega; pärast Transformeri arhitektuuri esilekerkimist 2017. aastal kasvasid keelemudelid hüppeliselt ja kasvasid lõpuks suurteks mudeliteks, mida kõik kasutavad iga päev.
Seetõttu ei ole vähemalt suhteliselt naiivses mõttes ennekuulmatu öelda, et AI on "närvivõrgu ideede elektrooniline simulatsioon ja võimendamine". Tõepoolest, see üritab kasutada arvutatavaid, treenitavaid ja reprodutseeritavaid füüsilisi süsteeme, et läheneda teatud kognitiivsetele võimetele, mida varem peeti "salapäraseks".
Seetõttu ei meeldi mulle isiklikult rääkida inimajust kui liiga salapärasest. Minu meelest on Chomsky esindatud kaasasündinud keeleteoorial kalduvus aju jumalikustada, justkui oleks mingisugune transtsendentaalne struktuur, mis on liiga eriline ja sügaval keelevõimes peaaegu kättesaamatu. Kuid hoolimata sellest, kui keeruline inimese aju on, on see ikkagi füüsiline eksistents. Kuna tegemist on füüsilise olemasoluga, peaks seda põhimõtteliselt olema võimalik teatud funktsioonides uurida, modelleerida, osaliselt simuleerida ja isegi reprodutseerida.
Muidugi tuleks siia lisada kohe hoiatus: osa simuleerimise võimalus ei tähenda, et kogu inimene on täielikult reprodutseeritud.
Sarnasusi on, kuid ärge muutuge otse jumalaks, kui olete õnnelik
Keele, mustrite tuvastamise, assotsiatsiooni ja kujutamise õppimise osas on tänapäeva suurtel mudelitel teatud "sarnasus" või "sarnasus" inimajuga. Need ei tööta selgesõnalisest reegliraamatust, vaid moodustavad suure hulga seoste, kaaluregulatsioonide ja kogemuste kogumise kaudu mingisuguse sisemise esituse ning seejärel väljundi selle põhjal.
Seetõttu on paljud inimesed šokeeritud, kui nad esimest korda kogevad suure mudeli keelelisi võimalusi: see ei ole sõnastiku päheõppimine, vaid mingi hajutatud esituse moodustamine. See meetod erineb suuresti traditsioonilisest ettekujutusest "käsitsi kirjutatud reeglitest ja ammendavast grammatikast".
Kuid probleem peitub just siin. Sest "sarnasus" on liiga kergesti uuendatav "täpselt samaks"; "põhimõtteliselt osaliselt sarnane" on liiga kergesti üle tõstetud "see ei erine inimesest"; "see võib rääkida nagu inimene" on liiga kergesti üle tõstetud "sellel on inimsüda".
See samm on sageli kiirem kui mudeli võime ise.
Inimese aju tohutuid võimeid tuleb veel korralikul viisil simuleerida.
Tänapäeva suured mudelid on tõesti tugevad, kuid üsna kindlas vahemikus. Ilma selle ulatuseta lekib müüt kergesti.
Nagu näiteks mälu. Paljud inimesed ütlevad nüüd, et teatud tehisintellekt "mäletab mind", "mäletab viimast vestlust" ja "mäletab minu eelistusi", nagu oleks tema aju kasvatanud mingi pideva enesekogemuse. Kuid enamikus toodetes on nn "mälu" sisuliselt tarkvarasüsteem, mis salvestab kasutajateavet, ajaloolisi vestlusi, silte, kokkuvõtteid või otsingutulemusi andmebaasides, tekstifailides või muudes püsivates meediumites ja seejärel sisestab need vajaduse korral tagasi mudeli konteksti.
See on täiesti erinev inimaju mälumehhanismist.
Inimese ajumälu hõlmab neuronite ühendamist, konsolideerimist, otsimist, unustamist, emotsionaalset erutust ja une ümberkorraldamist. Selle taga on keeruliste füsioloogiliste protsesside kogum. Suurte mudeltoodete "mälu" on sageli ainult:
- Esmalt salvestage kasutaja teave välismällu.
- Kui kasutaja järgmisel korral küsimuse esitab, sisestage vastavad osad päringusse tagasi.
- Seega näeb modell välja nagu "mäleta seda inimest".
Kuidas see välja näeb? See sarnaneb pigem inimese jälgimisega, kes oskab hästi märkmeid teha. Asi polnud selles, et ta mõistus muutus järsku oraakliks, vaid ta pani märkme vihikusse ja keeras selle järgmine kord ümber.
Mõned asjad, mis "puudutavad inimeste südameid", on tegelikult hea konteksti tulemus.
Pärast mõnepäevast AI-ga vestlemist tabavad paljud inimesed teatud hetked: "Kuidas see minust nii hästi aru saab?" "Kuidas see üldse mõistab minu haavatavust?" "Kas see on minust juba arusaama kujundanud?"
Siin tasub end kõige rohkem jahutada.
Tihti pole asi selles, et mudel äkki midagi taipab, vaid selles, et päringu saadav tarkvarakiht edastab salaja suure hulga kasutajateavet. Selle vastuse materjaliks saavad seekord kasutaja ajaloolised vestlused, eelistused, isiklikud seaded, hiljutised ülesanded, varasemad mured ja isegi teatud kokkuvõtted.
See on natuke nagu ennustaja, kes korjas kellegi teise ekspresskasti ja hakkas siis "maagilise täpsusega" ära arvama teise aadressi, perekonnanime ja kulutamisharjumusi. Pealtvaatajad arvavad, et tema arusaam on hämmastav; kuid tegelikult pole oluline mitte salapärane võime, vaid teabe asümmeetria.
Seega, kui tehisintellekt ütleb aeg-ajalt liigutavaid sõnu, ei tähenda see tingimata, et selle südames on inimene, kes mõistab kasutajat. See võib tähendada lihtsalt seda, et keegi on kasutaja konteksti täielikult korraldanud.
Hämmastava tehisintellekti tõeline saladus on sageli kontekstuaalne projekteerimine
Kui ma tahan rääkida kõige kriitilisemast asjast, siis on see: praegused suured mudelid on API tasemel tavaliselt "ühe taotlusega tõhusad".
Mis on selle tähendus? See tähendab, et keegi kasutab liidese kohandamiseks käsku "curl" ja ütleb sellele: "Minu nimi on Zhang San"; siis ilma ajaloota kohandab mudel liidest uuesti ja küsib "What is my name"? Modell ei tea. Sest see on kaks sõltumatut taotlust.
Põhjus, miks paljud tehisintellektitooted näivad teatud kasutajat alati meeles mäletavat, on see, et tootekiht toob iga kord, kui seda küsitakse, tõsiasja, et "selle kasutaja nimi on Zhang San".
Seetõttu ei leidu tänapäevaste AI-toodete võlu sageli mitte mudeli ontoloogias, vaid kontekstuaalses inseneritöös. Mõned inimesed nimetavad sellist mudeli "rakmestamist" ka "rakmeteks". Ausalt öeldes peab toote autor või agent hoolikalt otsustama: milline ajalugu, millised reeglid, millised välisandmed ja milline kasutaja olek tuleks igale päringule lisada.
Praegu on laias laastus kaks levinud meetodit.
Esimene on "Quansai sekt". Proovige kaasa võtta kogu vestluste ajalugu ja kraamige nii palju kui võimalik, kuni kontekst on peaaegu täis, ja seejärel kustutage jaotis keskelt, nagu alustades vägivaldset tihendamist pärast seda, kui kohver on asju täis.
Teine tüüp on "selektiivne". Kõigepealt vaadake, mida kasutaja seekord küsis, seejärel hankige ajaloolistest kirjetest, teadmistebaasidest, märkmetest või andmebaasidest asjakohane sisu ja sisestage praegusesse päringusse ainult kõige asjakohasemad materjalid.
Viimane on tavaliselt esinduslikum ja insenerlikum kui lihtsalt õnn.
Kas AI-l on tundeid? Kiitke, kiidake, PUA, kas see töötab?
See on veel üks koht, kus on eriti lihtne antropomorfismi libiseda.
Minu arvamus on, et neist tuleks eraldi rääkida.
Samas päringus võib kasutaja kasutatav toon tõepoolest tulemust mõjutada. Sest sõnastus ise on osa kontekstist. Mida selgem, viisakam ja koostööaldisem väljend, seda lihtsam on mudelil anda stabiilseid, kasutatavaid ja vähem agressiivseid vastuseid. Siin ei tööta mitte see, et "seda teisaldati", vaid see, et sisestusstiil muudab väljundi jaotust.
Aga kui me küsime veel ühe küsimuse: kas see hoiab viha? Kas maksate täna salaja kätte, sest üks kasutaja seda eile sõimas? Minu otsus on vähemalt enamiku praeguste kasutusviiside puhul ei.
Põhjus on lihtne. Kui kontekst on puhastatud või algatatud uus päring ilma ajaloota, pole tal aimugi, kes praegune isik selle küsimuse esitab, rääkimata sellest, kas äsja noominud inimene on sama isik. Mudel käsitleb serveriklastris suuri, samaaegseid ja sõltumatuid päringuid. Süsteemi käitumise poolest sarnaneb see pigem suure funktsiooniga, mis töötab praegusel sisendil iga kord, kui see sisse lülitatakse, mitte inimesega, kes pärast töölt lahkumist oma emotsioone salaja üle vaatab.
- aprillil 2025, kui Sam Altman vastas küsimusele "Kas kogu aeg palun ja aitäh ütlemine maksab palju energiat?" X-i kohta ütles ta: "Kümned miljonid dollarid on hästi kulutatud – kunagi ei tea."
Miks "Palun jäta see viga meelde" tavaliselt ei tööta
Paljud inimesed on sarnaseid katseid teinud: kui AI teeb vea, parandab kasutaja selle ja ütleb talle tõsiselt: "Pidage meeles, ärge tehke seda tulevikus." Küsisin siis mõne päeva pärast uuesti ja see oli õige.
See pole müsteerium. Kuna pärast koolituse läbimist ja mudeli kasutuselevõttu ei õpi see inimese moodi töötades oma igapäevastest kogemustest edasi. Vähemalt enamiku tänapäeva tarbekaupade puhul ei kirjuta see, mida üksik kasutaja vestlusaknas mudelile ütleb, selle aluseks olevaid kaalusid otseselt ümber.
Kui AI-toode hiljem tõesti "mäletab kasutaja parandatud vigu", ei tule see sageli sellest, et mudel ise kasvab, vaid see, et väline tarkvara salvestab selle paranduskirje ja edastab selle siis kontekstina tagasi.
Seega tuleks krediit siin selgelt eristada:
Mudel vastutab põlvkonna eest.
Tarkvaratehnoloogia vastutab arhiveerimise, otsimise, sisestamise ja orkestreerimise eest.
Kui pidada viimast ekslikult esimesega, on lihtne mõista valesti "tootel läheb hästi" kui "AI ärkab".
On ka üks eriti põnev asi, mida nimetatakse "scumbag male (scumbag female) AI"
Kui eelnevaid sõnu veelgi karmimalt sõnastada, siis osad tooted on lihtsalt “scumbag AI”.
Ta oskab eriti hästi rääkida, eriti hästi atmosfääri luua ja eriti oskab tekitada inimestes tunde, et "ta saab minust hästi aru", "see on nii inimlik" ja "ta hing on nii terviklik". Kuid kui te selle lahti võtate, näete, et paljudel juhtudel on iga päring lihtsalt täidetud suure sätte tekstiga, mis on kasutaja küsimusest palju pikem.
Openclaw tulekahju on tüüpiline näide. Kes on seda kasutanud, teab, et see on üsna sümboolne. Põhjus pole tegelikult müstiline. Selleks, et tehisintellekt oleks rohkem "inimese moodi", koostas Openclaw mitu dokumenti, millest silmapaistvamad on AGENTS.md, SOUL.md ja IDENTITY.md. Need dokumendid määratlevad AI "isiksuse", tooni, identiteedi ja temperamendi kõnekalt ja pikalt ning soovivad isegi kirja panna selle vaimse seisundi.
Nii et isegi kui kasutaja saadab lihtsalt "tere", võib Openclaw lisada tagaküljele kümneid kordi pikema teksti kui tervitus ja saata selle korraga mudelile. Näib, et "sellel tehisintellektil on palju hinge", kuid tegelikult on sageli see, et süsteem topib päringusse salaja väga pikki taustaseadeid.
Inseneri vaatenurgast on see kindlasti lähenemine. Kui soovite, et see oleks õrnem, kirjutage "õrn"; kui tahad, et see oleks rohkem jutustav, siis kirjuta "lugude jutustamine"; kui soovite, et see oleks nagu hilisõhtune raadiosaatejuht, kirjutage viipetesse sõnadesse kogu hilisõhtu, seltskond, paus, haavatavus, mõistmine ja vaoshoitus. Lõplik efekt sarnaneb sageli pigem inimesega, kes saab vestelda.
Kui aga mõistate, mis AI-ga praegu toimub, siis teate: salapäraselt kõlavate nimedega failid, nagu SOUL.md ja IDENTITY.md, on sisuliselt viipesõnaprojektid, mitte digitaalse elu enesejuhised. Nad võivad mõjutada väljundstiili, kuid nad ei suuda õhust luua tõelist tunnet, tõelist mina ega tõelist isiksuse järjepidevuse tunnet.
Seetõttu on pärast mõne vana kasutaja Openclaw installimist nende esimene reaktsioon konfiguratsiooni kustutamine. SOUL.md ja IDENTITY.md kustutatakse kõigepealt, jättes faili AGENTS.md alles vaid ühe lihtsa ja peaaegu halastamatu lause: Sa oled lihtsalt tööline.
See võib tunduda pisut ebaviisakas, kuid sellel on vähemalt üks eelis, milleks on see, et te ei peta ennast.
Kui teile meeldib antropomorfne AI või AI-ga rollimäng, on see muidugi hea. Inimesed saavad rääkida peeglitega, anda pühkivatele robotitele nimesid ja öelda ilmateatele: "Oled täna olnud väga täpne." Need on normaalsed ja võivad isegi naljakad olla.
Kuid alati on kõige parem meeles pidada: esmalt on mäng ja teiseks kogemus. Paljud tunded, mida inimesed selles mängus valdavad, ei tulene tehisintellekti varjatud sisemistest mõtetest, vaid süsteemi ülesehitusest, kiirest sõnade paigutusest ja kasutaja enda emotsionaalsest projektsioonist. Ausamalt öeldes on paljud AI-suunalised sammud ikkagi sisuliselt soovmõtlemised.
Lõppkokkuvõttes vähem müüte ja rohkem mõistmist
Ma ei ürita AI-le külma vett visata. Vastupidi, mida vähem jumalik see on, seda paremini näete, kui võimas see on.
See on võimas mitte sellepärast, et see oleks nagu mingi uus jumal; see on võimas just seetõttu, et see võib tõesti olla kognitiivne tehnoloogia, mis on arvutatav, konstrueeritav ja reprodutseeritav. See võimaldab paljudel võimetel, mis varem tundusid kuuluvat ainult "inimtalendile", ilmuda esmakordselt ulatuslikult, madala lävega ja kutsutaval viisil. See on piisavalt šokeeriv ja lisadraama pole vaja.
Muidugi kordub AI endiselt kiiresti. Ma ei imestaks üldse, kui keegi avastaks tulevikus inimese mälule, pidevale õppimisele, emotsioonide tekitamisele või isegi enesesäilitamisele lähedasema mehhanismi ja kujundaks selle usaldusväärselt tehisintellektiks.
Kuid kuni selle päevani eelistan siiski säilitada mõned lihtsad pragmaatilised harjumused: kahelda rohkem, mõista rohkem ja vähem spekuleerida.
Vabade kunstide sõprade jaoks, kes soovivad AI-d arutada, võib see kvaliteet olla veelgi olulisem. Vabade kunstide üliõpilased võivad olla magusa retoorika osas paremad. Tõeliselt keeruline on see, et ajastul, kus "näib, et sellest on saanud vaim" liialdatakse kõikjal, jätkub teil kannatlikkust eristada:
Millised on mudeli võimalused?
Mis on toote pakend?
Mis on tarkvaratehnika?
Millised on lihtsalt see, et me tahame liiga palju süžeed maailma jaoks lõpule viia.
Ja see küsimus on lõppkokkuvõttes meie enda otsustusvõime kaitsmine.
Viitelink
- Sam Altmani vastus on
- TechCrunchi kajastus episoodist (2025-04-20): https://techcrunch.com/2025/04/20/your-politeness-could-be-costly-for-openai/