Ihmisten harhaluulot tekoälystä ovat pahempia kuin tekoäly-hallusinaatiot
Joskus minusta tuntuu, että tekoälyn suurin "illuusio" ei ole se, että se puhuu hölynpölyä vakavasti, vaan että olemme kuvitelleet koko metafyysisen universumin sen ympärille.
Kun ihmiset kohtaavat asioita, joita he eivät aivan ymmärrä, heillä on usein vakaa lähestymistapa: he ensin päättävät ja sitten romantisoivat ne; ne ensin personoivat ne ja sitten jumalallistavat ne. Liekkiä pidetään tonttuina, ja ukkonen ja salamoita pidetään huolenpitona. Kun algoritmi osaa kirjoittaa kaksi kunnollista lausetta, jotkut ihmiset ihmettelevät heti, onko palvelinhuoneessa jo asunut elektroninen sielu.
Tämä on itse asiassa aivan normaalia. Ihmisaivot on kytketty lisäämään juonen maailmaan. Ongelma ei ole siinä, että pystymme päättämään. Ongelmana on, että kun ajattelumme on liian sujuvaa, on helppo erehtyä "näyttää" sanaan "olennaisesti on".
Tekoälyn tapauksessa tämä ihmisten taipumus on jopa vahvempi kuin silloin, kun tekoäly itse puhuu hölynpölyä. Tekoäly on korkeintaan pieni hallusinaatio vastauksessa; ihmisten tekoälyä koskevat hallusinaatiot ovat usein koko maailmankuva, joka voi täyttää jopa 10 000 sanaa yhdessä mielessä ja sisältää myös tunteita.
Pieni pragmatismi on erityisen tärkeää vapaiden taiteiden yhteisölle
En halua neuvoa kaikkia oppimaan CUDA:ta, konfiguroimaan ympäristöä ja katsomaan matriiseja johdannaisten löytämiseksi. Haluan vain sanoa, että totuuden tavoittelu on joskus todella tärkeää, varsinkin käsitteitä, tarinoita, merkityksiä ja selityksiä rakastavalle taideyhteisölle.
Sillä taiteiden kontekstissa tapahtuu todennäköisimmin lempeä, mutta vaarallinen liukas rinne: sanat ovat kauniisti kirjoitettuja ja lauseet liikkuvat, mutta loppujen lopuksi kohde vaihtuu salaa. Se on ilmeisesti todennäköisyysmalli, mutta se on kirjoitettu kuin se puhuisi sielusta; se on ilmeisesti kontekstin kokoonpanoa ohjelmistosuunnittelussa, mutta se on sanottu kuin "se vihdoin oppi rakastamaan sinua"; Ilmeisesti järjestelmäkehotteet ja historialliset tietueet toimivat, mutta se on pakattu seuraavasti: "AI todella muistaa sinut."
Runollisuudessa ei todellakaan ole syntiä. Ongelmana on, että jos runous korvaa tuomion, romanssista tulee harhaanjohtavaa.
Joten mikä AI nyt tarkalleen on?
Aloitan versiolla, joka on mahdollisimman yksinkertainen, mutta ei vääristynyt: Suuret mallit, joiden kanssa kaikki joutuvat nykyään kosketuksiin, ovat pohjimmiltaan eräänlaisia tilastollisia malleja, jotka ovat inspiroineet hermoverkkoja ja joita on koulutettu massiivisella datalla. Se toimii siruilla ja palvelimilla, lukee syötteitä, yhdistää parametrit ja kontekstin ja ennustaa jatkuvasti "mikä seuraavaksi sopivimman tunnuksen pitäisi olla".
Tässä ei ole kyse siitä, että ilmaus "ennusta seuraava sana" on salaperäinen, vaan se, että se ei itse asiassa ole lainkaan mystinen. Malli ei ole pikkuihminen pilvissä hiljaa elämää ajatteleva, vaan pikemminkin äärimmäisen valtava toiminto. Ihmiset antavat sille syötteen ja se tuottaa tulosteen harjoittelun aikana muodostuneen parametrirakenteen mukaisesti.
Asian maanläheisemmin sanottuna: se ei ole "sano se, kun olet ymmärtänyt sen", vaan "suuren kokemuksen tiivistämisen jälkeen luo vastaus, joka muistuttaa eniten ymmärrystä nykyisessä kontekstissa". Tämä ei tarkoita, että se ei voi tehdä mitään, päinvastoin, se on jo erittäin voimakas; mutta voimakkuus ei tarkoita, että se olisi mystistä.
Miksi hermoverkot saavat ihmiset aina ajattelemaan ihmisaivoja?
Jos jatkat sen jatkamista, huomaat, että kysymys "muistuttavatko tekoäly ja ihmisen aivot toisiaan?" ei voida sanoa olevan "täsmälleen sama" eikä "ei ole mitään tekemistä sen kanssa".
Nykyaikaisten hermoverkkojen reitti on alun perin inspiroitunut aivoista. Vuonna 1943 McCulloch ja Pitts kuvasivat matemaattisesti yksinkertaistetun neuronimallin; vuonna 1958 Rosenblatt ehdotti perceptronia; 1980-luvulla backpropagation sytytti uudelleen toivon monikerroksisten verkkojen kouluttamisesta; 2010-luvulla syväoppiminen lisääntyi laskentatehon, datan ja suunnittelukyvyn myötä; Transformer-arkkitehtuurin ilmestymisen jälkeen vuonna 2017 kielimallit nousivat huimasti ja kasvoivat lopulta suuriksi malleiksi, joita kaikki käyttävät päivittäin.
Siksi ei ainakaan suhteellisen naiivissa mielessä ole törkeää sanoa, että tekoäly on "sähköinen simulointi ja hermoverkkoideoiden vahvistaminen". Se todellakin yrittää käyttää laskettavia, koulutettavia ja toistettavia fyysisiä järjestelmiä lähestyäkseen tiettyjä kognitiivisia kykyjä, joita pidettiin aiemmin "salaperäisinä".
Tästä syystä en henkilökohtaisesti halua puhua ihmisaivoista liian salaperäisiksi. Mielestäni Chomskyn edustamalla synnynnäisellä kieliteorialla on taipumus jumalallistaa aivot, ikään kuin siellä olisi jonkinlainen transsendenttinen rakenne, joka on liian erityinen ja lähes saavuttamaton syvällä kielikyvyssä. Mutta riippumatta siitä, kuinka monimutkaiset ihmisaivot ovat, ne ovat silti fyysinen olemassaolo. Koska se on fyysinen olemassaolo, sitä pitäisi periaatteessa voida tutkia, mallintaa, osittain simuloida ja jopa toistaa tietyissä toiminnoissa.
Tietenkin meidän on heti lisättävä tähän varoituksen sana: osan simuloiminen ei tarkoita, että koko henkilö olisi täysin toistettu.
Yhtäläisyyksiä on, mutta älä tule suoraan jumalaksi, kun olet onnellinen
Kielen, hahmontunnistuksen, assosiaatio- ja esitysoppimisen suhteen nykypäivän suurilla malleilla on jonkin verran "samankaltaisuutta" tai "samankaltaisuutta" ihmisaivojen kanssa. Ne eivät toimi nimenomaisesta sääntökirjasta, vaan muodostavat jonkinlaisen sisäisen esityksen lukuisten yhteyksien, painonsäätöjen ja kokemusten kertymisen kautta ja sitten tuotoksen tämän perusteella.
Tästä syystä monet ihmiset ovat järkyttyneitä, kun he kokevat ensimmäisen kerran suuren mallin kieliominaisuudet: se ei ole sanakirjan ulkoa ottamista, vaan jonkinlaisen hajautetun esityksen muodostamista. Tämä menetelmä eroaa suuresti perinteisestä mielikuvituksesta "käsinkirjoitetuista säännöistä ja tyhjentävästä kielioppista".
Mutta ongelma on juuri tässä. Koska "samankaltaisuus" on liian helppo päivittää "täsmälleen samaksi"; "periaatteeltaan osittain samanlainen" on liian helposti päivitetty muotoon "se ei eroa ihmisestä"; "se osaa puhua kuin ihminen" on liian helposti päivitetty "sillä on ihmissydän".
Tämä vaihe on usein nopeampi kuin itse mallin ominaisuus.
Ihmisaivojen valtavia kykyjä ei ole vielä simuloitu kunnollisesti.
Nykypäivän suuret mallit ovat todella vahvoja, mutta ne ovat vahvoja melko tietyllä alueella. Ilman tätä laajuutta myytti vuotaa helposti.
Kuten muisti. Monet ihmiset sanovat nyt, että tietty tekoäly "muistaa minut", "muistaa viimeisen keskustelun" ja "muistaa valintani", ikään kuin sen aivot olisivat kasvattaneet jonkinlaista jatkuvaa itsekokemusta. Mutta useimmissa tuotteissa niin sanottu "muisti" on olennaisesti ohjelmistojärjestelmä, joka tallentaa käyttäjätiedot, historialliset keskustelut, tunnisteet, yhteenvedot tai hakutulokset tietokantoihin, tekstitiedostoihin tai muihin pysyviin tietovälineisiin ja lisää ne sitten takaisin mallin kontekstiin tarvittaessa.
Tämä on täysin erilaista kuin ihmisaivojen muistimekanismi.
Ihmisen aivojen muistiin kuuluu hermosolujen yhdistäminen, konsolidointi, hakeminen, unohtaminen, emotionaalinen kiihottuminen ja unen uudelleenjärjestely. Sen takana on joukko monimutkaisia fysiologisia prosesseja. Suurien mallituotteiden "muisti" on usein vain:
- Tallenna ensin käyttäjän tiedot ulkoiseen tallennustilaan.
- Kun käyttäjä kysyy seuraavan kerran, laita asiaankuuluvat osat takaisin pyyntöön.
- Joten malli näyttää "muista tämä henkilö".
Miltä se näyttää? Se on enemmän kuin katsoisi jonkun, joka on hyvä tekemään muistiinpanoja. Ei se, että hänen mielensä yhtäkkiä muuttui oraakkeliksi, hän vain laittoi muistiinpanon muistikirjaansa ja käänsi sen seuraavan kerran.
Jotkut asiat, jotka "koskettavat ihmisten sydämiä", ovat itse asiassa seurausta hyvästä kontekstista.
Kun olet keskustellut tekoälyn kanssa muutaman päivän, monet ihmiset kohtaavat tietyt hetket: "Kuinka se ymmärtää minua niin hyvin?" "Kuinka se voi edes ymmärtää haavoittuvuuttani?" "Onko se jo muodostanut ymmärryksen minusta?"
Täällä kannattaa jäähtyä.
Usein kyse ei ole siitä, että malli yhtäkkiä tajuaisi jotain, vaan se, että pyynnön lähettävä ohjelmistokerros toimittaa salaa suuren määrän käyttäjän tietoja. Käyttäjän historialliset chatit, mieltymykset, henkilökohtaiset asetukset, viimeaikaiset tehtävät, aiemmat huolet ja jopa tietyt yhteenvedot tulevat tällä kertaa materiaalina sen vastaukselle.
Se on vähän kuin ennustaja, joka poimi jonkun toisen pikapostilaatikon ja alkoi sitten arvailla toisen osoitetta, sukunimeä ja kulutustottumuksia "taikatarkkuudella". Katsojat ajattelevat, että hänen näkemyksensä on hämmästyttävä; mutta todella tärkeää ei ole salaperäinen kyky, vaan tiedon epäsymmetria.
Siksi, kun tekoäly sanoo toisinaan koskettavia sanoja, se ei välttämättä tarkoita, että sen sydämessä on henkilö, joka ymmärtää käyttäjää. Se voi tarkoittaa vain sitä, että joku on järjestänyt käyttäjää koskevan kontekstin täysin.
Hämmästyttävän tekoälyn todellinen salaisuus on usein kontekstuaalinen suunnittelu
Jos haluan vain puhua kriittisimmästä asiasta, se on: nykyiset valtavirran suuret mallit ovat yleensä "yhden pyynnön tehokkaita" API-tasolla.
Mitä se tarkoittaa? Eli joku käyttää "curl"-komentoa käyttöliittymän säätämiseen kerran ja sanoo "Nimeni on Zhang San"; sitten ilman historiaa malli säätää käyttöliittymää uudelleen ja kysyy "Mikä on nimeni"? Malli ei tiedä. Koska sille nämä ovat kaksi itsenäistä pyyntöä.
Syy, miksi monet tekoälytuotteet näyttävät aina muistavan tietyn käyttäjän, johtuu siitä, että tuotekerros palauttaa sen tosiasian, että "tämän käyttäjän nimi on Zhang San" joka kerta kun sitä pyydetään.
Siksi tämän päivän tekoälytuotteiden taikuutta ei usein löydy malliontologiasta, vaan kontekstuaalista suunnittelusta. Jotkut ihmiset kutsuvat myös tällaista mallin "valjastamista" "valjaaksi". Suoraan sanottuna tuotteen tai edustajan on päätettävä huolellisesti: mikä historia, mitkä säännöt, mitkä ulkoiset tiedot ja mikä käyttäjän tila tulee sisällyttää kuhunkin pyyntöön.
Tällä hetkellä käytössä on suunnilleen kaksi yleistä menetelmää.
Ensimmäinen on "Quansai-lahko". Yritä tuoda koko chat-historia mukaasi ja tavaraa niin paljon kuin mahdollista, kunnes konteksti on melkein täynnä, ja poista sitten osio keskeltä, aivan kuten aloittaisit väkivaltaisen pakkaamisen, kun matkalaukku on täynnä tavaraa.
Toinen tyyppi on "selektiivinen". Katso ensin, mitä käyttäjä kysyi tällä kertaa, hae sitten asiaankuuluvaa sisältöä historiallisista tietueista, tietokannoista, muistiinpanoista tai tietokannoista ja lisää vain olennaisimmat materiaalit nykyiseen pyyntöön.
Jälkimmäinen on yleensä enemmän esillepanoa ja suunnittelua kuin vain onnea.
Onko tekoälyllä tunteita? Ylistäkää, moittikaa, PUA sitä, toimiiko se?
Tämä on toinen paikka, jossa on erityisen helppo pudota antropomorfismiin.
Minun mielestäni niistä pitäisi keskustella erikseen.
Samassa pyynnössä käyttäjän käyttämä ääni voi todellakin vaikuttaa tulokseen. Koska sanamuoto itsessään on osa kontekstia. Mitä selkeämpi, kohteliaampi ja yhteistyökykyisempi ilmaisu on, sitä helpompi mallin on antaa vakaita, käyttökelpoisia ja vähemmän aggressiivisia vastauksia. Tässä ei toimi se, että "se siirrettiin", vaan se, että syöttötyyli muuttaa tulosten jakautumista.
Mutta jos kysymme toisen kysymyksen: Onko se kaunaa? Aiotteko kostaa salaa tänään, koska käyttäjä moitti sitä eilen? Minun tuomioni on, ainakin useimpien nykyisten käyttöönottojen osalta, ei.
Syy on yksinkertainen. Kun konteksti on tyhjennetty tai uusi pyyntö ilman historiaa käynnistetään, sillä ei ole aavistustakaan, kuka nykyinen henkilö kysyy, saati siitä, onko sitä juuri moittinut henkilö sama henkilö. Malli käsittelee massiivisia, samanaikaisia ja riippumattomia pyyntöjä palvelinklusterissa. Järjestelmän käyttäytymisen kannalta se on enemmän kuin suuri toiminto, joka toimii nykyisellä tulolla joka kerta, kun se kytketään päälle, eikä henkilö, joka tarkistaa tunteitaan salaa töistä poistuttuaan.
- huhtikuuta 2025, kun Sam Altman vastasi kysymykseen "Maksaako kiitos ja kiitos koko ajan paljon energiaa?" X:ssä hän sanoi "kymmeniä miljoonia dollareita hyvin käytettyjä - ei koskaan tiedä."
Miksi "Muista tämä virhe" ei yleensä toimi
Monet ihmiset ovat tehneet samanlaisia kokeita: kun tekoäly tekee virheen, käyttäjä korjaa sen ja sanoo vakavasti: "Muista, älä tee sitä enää tulevaisuudessa." Sitten kysyin uudelleen muutaman päivän kuluttua, ja se oli oikein.
Tämä ei ole mysteeri. Koska koulutus on suoritettu ja malli otettu käyttöön, se ei jatka oppimista päivittäisistä kokemuksistaan työskennellessään ihmisen tavoin. Ainakin useimmissa kuluttajatuotteissa nykyään se, mitä yksittäinen käyttäjä sanoo mallille chat-ikkunassa, ei kirjoita suoraan taustalla olevia painoja.
Jos tekoälytuote myöhemmin todella "muistaa käyttäjän korjaamat virheet", se ei useinkaan johdu itse mallin kasvusta, vaan siitä, että ulkoinen ohjelmisto tallentaa tämän korjaustietueen ja syöttää sen sitten takaisin kontekstina.
Luotto on siis erotettava selvästi tästä:
Malli vastaa sukupolvelta.
Ohjelmistosuunnittelu vastaa arkistointi, haku, injektio ja orkestrointi.
Jälkimmäisen erehtyessä entiseen on helppo tulkita väärin "tuotteella menee hyvin" kuin "AI heräämässä".
On myös erityisen kiehtova asia nimeltä "scumbag male (scumbag female) AI"
Jos aikaisemmat sanat vielä ankarammin ilmaistaan, niin jotkut tuotteet ovat yksinkertaisesti "roska-AI".
Se on erityisen hyvä puhumaan, erityisen hyvä luomaan ilmapiiriä ja osaa erityisesti saada ihmiset tuntemaan, että "se ymmärtää minua hyvin", "se on niin inhimillistä" ja "sen sielu on niin täydellinen". Mutta kun purat sen osiin, huomaat, että monissa tapauksissa jokainen pyyntö on vain täynnä suuri asetusteksti, joka on paljon pidempi kuin käyttäjän kysymys.
Openclaw-palo on tyypillinen esimerkki. Jokainen, joka on sitä käyttänyt, tietää, että se on melko token-intensiivinen. Syy ei itse asiassa ole mystinen. Tehdäkseen tekoälystä enemmän "ihmisenä" Openclaw suunnitteli useita asiakirjoja, joista näkyvimmät ovat AGENTS.md, SOUL.md ja IDENTITY.md. Nämä asiakirjat määrittelevät tekoälyn "persoonallisuuden", sävyn, identiteetin ja luonteen kaunopuheisesti ja pitkällä tavalla ja haluavat jopa kirjoittaa muistiin sen henkisen tilan.
Joten vaikka käyttäjä vain lähettäisi "hei", Openclaw voi liittää taakseen kymmeniä kertoja pidemmän tekstin ja lähettää sen mallille kerralla. Näyttää siltä, että "tässä tekoälyssä on paljon sielua", mutta itse asiassa usein se on vain järjestelmä, joka täyttää pyyntöön salaa erittäin pitkiä taustaasetuksia.
Insinöörin näkökulmasta tämä on varmasti lähestymistapa. Jos haluat sen olevan lempeämpi, kirjoita "hellävarainen"; jos haluat sen olevan enemmän tarinankerrontaa, kirjoita "tarina"; Jos haluat sen olevan kuin myöhäisillan radiojuontaja, kirjoita kaikki myöhäisillan, kumppanuuden, tauon, haavoittuvuuden, ymmärryksen ja pidättyväisyyden sanoilla. Lopullinen vaikutus on usein enemmän kuin henkilö, joka voi keskustella.
Mutta jos ymmärrät, mitä tekoälyn kanssa nyt tapahtuu, tiedät: tiedostot, joilla on salaperäiseltä kuulostavat nimet, kuten SOUL.md ja IDENTITY.md, ovat pohjimmiltaan kehotteita sanaprojekteja, eivät itseohjauksia digitaaliseen elämään. Ne voivat vaikuttaa tuotantotyyliin, mutta he eivät voi luoda tyhjästä todellista tunnetta, todellista itseä tai todellista persoonallisuuden jatkuvuuden tunnetta.
Siksi, kun jotkut vanhat käyttäjät ovat asentaneet Openclaw'n, heidän ensimmäinen reaktionsa on poistaa kokoonpano. SOUL.md ja IDENTITY.md poistetaan ensin, jolloin jäljelle jää vain yksi yksinkertainen ja lähes häikäilemätön lause `AGENTS.md:ssä: Olet vain työntekijä.
Tämä saattaa kuulostaa hieman töykeältä, mutta sillä on ainakin yksi etu, se, että et petä itseäsi.
Jos pidät antropomorfisesta tekoälystä tai roolileikkeistä tekoälyn kanssa, se on tietysti hyvä. Ihmiset voivat puhua peileille, antaa nimiä lakaisuroboteille ja sanoa sääennusteelle: "Olet ollut erittäin tarkka tänään." Nämä ovat normaaleja ja voivat jopa olla hauskoja.
Mutta on aina parasta muistaa: se on peli ensin ja kokemus sitten. Monet tämän pelin ihmisten tunteista eivät johdu tekoälyn piilotetuista sisäisistä ajatuksista, vaan järjestelmän suunnittelusta, nopeasta sanajärjestelystä ja käyttäjän omasta tunneprojektiosta. Suoraan sanottuna monet liikkeet kohti tekoälyä ovat edelleen pohjimmiltaan toiveajattelua.
Loppujen lopuksi vähemmän myyttejä ja enemmän ymmärrystä
En yritä heittää kylmää vettä tekoälyn päälle. Päinvastoin, mitä vähemmän jumalallinen se on, sitä enemmän voit todella nähdä kuinka voimakas se on.
Se ei ole voimakas siksi, että se olisi kuin joku uusi jumala; se on voimakas juuri siksi, että se voi todella olla kognitiivinen tekniikka, joka on laskettavissa, muokattavissa ja toistettavissa. Se sallii useiden kykyjen, jotka näyttivät kuuluvan vain "ihmislahjoille" aiemmin, esiintyä laajamittaisella, matalan kynnyksen ja kutsuttavalla tavalla ensimmäistä kertaa. Tämä on tarpeeksi järkyttävää, eikä lisädraamaa tarvita.
Tietenkin AI toistuu edelleen nopeasti. En yhtään ihmettelisi, jos joku todellakin löytäisi tulevaisuudessa mekanismin, joka on lähempänä ihmisen muistia, jatkuvaa oppimista, tunteiden luomista tai jopa itsensä ylläpitämistä ja suunnittelee sen luotettavasti tekoälyksi.
Mutta siihen asti, kunnes se päivä koittaa, pidän silti mieluummin kiinni joistakin yksinkertaisista pragmaattisista tavoista: epäillä enemmän, ymmärtää enemmän ja spekuloida vähemmän.
Taiteiden ystäville, jotka haluavat keskustella tekoälystä, tämä ominaisuus voi olla vielä tärkeämpi. Taiteiden opiskelijat voivat olla parempia makeassa retoriikassa. Todella vaikeaa on se, että aikakaudella, jolloin "se näyttää tulleen hengeksi" liioittelee kaikkialla, sinulla on vielä kärsivällisyyttä erottaa:
Mitkä ovat mallin ominaisuudet?
Mikä on tuotteen pakkaus?
Mitä on ohjelmistosuunnittelu?
Mitkä ovat vain sitä, että haluamme viedä juonen loppuun liikaa.
Ja tässä asiassa on viime kädessä kyse oman harkintakykymme suojelemisesta.
Viitelinkki
- Sam Altmanin vastaus päällä
- TechCrunchin kattavuus jaksosta (2025-04-20): https://techcrunch.com/2025/04/20/your-politeness-could-be-costly-for-openai/