Ihmiskunta rakentaa tällä hetkellä tekoälyjärjestelmiä, jotka ovat erittäin tottelevaisia oppilaita. Ne toistavat koulutusdatasta löytyvän tiedon, mutta eivät haasta sitä. Tämän takia nykyiset mallit eivät synnytä tieteellisiä läpimurtoja, sanoo avointen tekoälymallien kirjastoa ylläpitävän Hugging Facen perustaja ja strategiajohtaja Thomas Wolf.
Hugging Face on kolmen ranskalaisen Yhdysvaltoihin perustama yhtiö, joka tarjoaa tekoälytyökaluja ohjelmistojen kehittämiseen. Sitä pidetään yhtenä tekoälykentän keskeisimpänä alustana.
– Merkittävä osa tieteen tekemisestä on käytännössä sitä, että kyseenalaistaa vallitsevat näkemykset, Wolf toteaa.
Hän ottaa esimerkiksi tähtitieteilijä Nikolaus Kopernikuksen, joka 1500-luvulla esitti, että Maa kiertää Aurinkoa eikä päinvastoin. Kopernikus haastoi vallitsevan totuuden omilla laskelmillaan.
Nykyiset tekoälyjärjestelmät eivät tähän pysty, koska niitä ei ole rakennettu suhtautumaan kriittisesti niihin syötettyyn koulutusdataan. Lisäksi mallit on usein viritetty niin, että ne mielistelevät mahdollisimman paljon käyttäjäänsä.
Wolf ei tarkoita, että ratkaisu olisi luoda malli, joka sanoo kaikkeen vastaan. Tekoäly pitäisi kuitenkin saada kysymään oikeita kysymyksiä.
– Se tarkoittaa sitä, että mietitään, pitäisikö meidän syventyä tähän kysymykseen. Entä jos meidän pitäisi oikeasti tutkia tätä ilmiötä? Ja tämä on tällä hetkellä todella vaikeaa saada malleihin, Wolf sanoo.
Nykyinen tekoäly on tieteilijänä kuin taskulaskin
Nykyiset tekoälyjärjestelmät kykenevät ratkaisemaan yhä monimutkaisempia tehtäviä. Niiden kyky tehdä tieteellisiä läpimurtoja on kuitenkin samalla janalla taskulaskimen kanssa. Toisin sanoen ne tarvitsevat ihmisen ollakseen hyödyllisiä.
Chat GPT:n kehittäneen tekoäly-yhtiö Open AI:n toimitusjohtaja Sam Altman on samoilla Wolfin kanssa linjoilla. Altman totesi taannoin Big Technology -podcastissa, ettei tekoäly vielä kykene itsenäisesti tieteellisiin läpimurtoihin.
– Itse omat kysymyksensä muotoilevat mallit tuntuvat vielä kaukaiselta tulevaisuudelta, Altman sanoo.
Tämä ei Altmanin mukaan vähennä tekoälymallien arvoa. Hän uskoo, että tekoälyn avulla tehdään tieteellisiä läpimurtoja jo lähivuosina.
– Tapahtuipa se sitten älykkäämpien ihmisten tai älykkäämpien mallien ansiosta, olen erittäin tyytyväinen niin kauan kuin saamme aikaan tieteellisiä löytöjä, Altman pohtii.
Asuuko datakeskuksessa tulevaisuudessa ”nerojen kansakunta”?
Ehkä hieman yllättäen Altmanin puheet tekoälyn mahdollisuuksista kuulostavat maltillisilta, kun niitä vertaa kilpailevan tekoäly-yhtiö Anthropicin toimitusjohtajan Dario Amodein pohdintoihin.
Amodei kirjoitti vuosi sitten pitkän ylistyskirjoituksen tekoälylle. Siinä hän visioi datakeskuksessa asuvan nerojen kansakunnan, joka kykenee itsenäisesti tekemään tieteellisiä läpimurtoja.
– Arvelen, että tehokas tekoäly voisi jopa kymmenkertaistaa tieteellisten löytöjen tahdin ja tuoda meille seuraavan 50–100 vuoden biologisen kehityksen jo 5–10 vuodessa, Amodei kirjoittaa esseessään.
Amodei uskoo, että tekoälystä voisi kehittyä aktiivinen toimija.
Wolf ei jaa tätä näkemystä, ja hän kirjoitti jo keväällä vastauksensa Amodein visioon. Siinä hän huomautti, että nykykehityksellä datakeskuksiin ei synny nerojen vaan ennemminkin myötäilijöiden kansakunta.
Linuxin resepti voisi toimia myös tekoälyn kohdalla
Wolf uskoo, että avoin lähdekoodi voi olla ratkaisu parempia kysymyksiä esittävän tekoälyn kehittämisessä. Kuka tahansa voi avata avoimen lähdekoodin mallin ja virittää sen kykyä esittää kysymyksiä.
Wolf huomauttaa, että avoimen lähdekoodin ohjelmat ovat aikaisemminkin voittaneet kilpailun suljettuja järjestelmiä vastaan. Hän ottaa esimerkiksi ohjelmistojätti Microsoftin.
– Kaksikymmentä vuotta sitten Microsoft oli Windows-käyttöjärjestelmänsä kanssa täysin suljettu. Nyt Microsoft on yksi maailman suurimmista avoimen lähdekoodin toimijoista, Wolf toteaa.
Samalla tavalla suomalaislähtöinen avoimen lähdekoodin Linux-käyttöjärjestelmä on vallannut palvelinpuolen järjestelmät. Myös Android-käyttöjärjestelmä on rakennettu Linuxin päälle.
Wolf muistuttaa, että avoimella lähdekoodilla on joukko vahvuuksia, joita suljetulla lähdekoodilla ei ole. Vahvuudet liittyvät yhteisöön, joka etsii järjestelmästä virheitä, kehittää uusia ominaisuuksia ja antaa jatkuvasti palautetta.
– Sama resepti, joka nosti Linuxin Unix-järjestelmien ja palvelinpuolen hallitsevaksi alustaksi, voisi olla myös resepti sille, miten haluamme rakentaa tekoälyä pitkällä aikavälillä, Wolf pohtii.
Kiina noussut hallitsemaan avoimen lähdekoodin malleja
Tällä hetkellä avoimen lähdekoodin tekoälymalleja kehitetään etenkin Kiinassa. Vuosi sitten kohistiin kiinalaisesta Deepseek-mallista, joka oli poikkeuksellisen tehokas tekoälymalli. Uutinen vähemmän laskentatehoa tarvitsevasta mallista romahdutti hetkellisesti sirujätti Nvidian osakekurssin.
Wolf kuvailee Deepseekiä avoimen lähdekoodin Chat GPT -hetkeksi. Se nosti avoimen lähdekoodin mallit kaikkien tietoisuuteen.
Syksyn aikana tekoälypiireissä on ihmetelty kiinalaisen tekoäly-yhtiö Moonshot AI:n Kimi-mallia, joka kykenee hallitsemaan erilaisia työkaluja samalla tai jopa korkeammalla tasolla kuin isojen tekoäly-yhtiöiden suljetut mallit.
Kiinalaisten mallien nousu on huomattu Yhdysvalloissa. Uusia avoimen lähdekoodin malleja kehittäviä yhtiöitä on perustettu ja jopa Open AI on julkaissut avoimen mallin ensimmäistä kertaa moneen vuoteen.
Nyt myös Euroopan pitäisi keksiä itselleen rooli tässä kehityksessä, Wolf sanoo. Ranskalainen tekoäly-yhtiö Mistral on näyttänyt tietä, mutta se ei yksin riitä.
Suomessa avoimen lähdekoodin malleja on kehittänyt tekoäly-yhtiö Silo AI. Yhtiö myytiin viime vuonna amerikkalaiselle siruyhtiö AMD:lle.