Yliopisto kehitti 600 dollarilla tekoälyn ja lähetti sen saman tien

Yliopisto kehitti 600 dollarilla tekoälyn ja lähetti sen saman tien

Stanfordin yliopiston tutkijaryhmä päätti kokeilla, kuinka helppoa olisi luoda valtaisaa mediahuomiota saanutta ChatGPT:tä vastaava tekoälyalgoritmi omin voimin. Kokeilu onnistui ja on herättänyt huolta siitä, miten helppoa ja halpaa vastaava voisi olla kenelle tahansa.

Tutkijat ottivat pohjakseen Metan avoimen lähdekoodin LLaMA-kielimalleista pienimmän, LLaMA 7B:n. Vaikka se on esikoulutettu tuhannella miljardilla datapisteellä, ei se sellaisenaan ole kauhean älykäs: kielimallit kun myös koulutettava oppimaan asiayhteyksiä.

Tutkijat ottivat tähän avuksi ChatGPT:n, antoivat sille 175 oikeanlaista kysymys-vastaus-paria ja pyysivät sitä luomaan samanlaisia lisää. Tämä hoitui näppärästi ChatGPT:n avointen rajapintojen kautta, ja pian kasassa olikin 52 000 koulutuskysymystä ja -vastausta. Tähän kului alle 500 dollaria.

Tämän jälkeen tutkijat kouluttivat LLaMA 7B:tä näillä kysymyksillä. Ostamalla pilvikäyttöaikaa kahdeksalle 80-GB A100 -suorittimelle tähän meni kolmisen tuntia, mikä maksoi alle 100 dollaria.

Tuloksena oli valmis kielimalli, jolle tutkijat antoivat nimen Alpaca. Testeissä se osoittautui ChatGPT:n veroiseksi monissa työtehtävissä, kuten sähköpostien ja sosiaalisen median kirjoitusten laatimisessa. Tutkijat julkaisivat käyttämänsä koulutuskysymykset GitHubissa ja avasivat myös itse tekoälylle web-käyttöliittymän.

Mielenkiinto Alpaca-tekoälyä kohtaan oli räjähdysmäistä, ja tutkijat ottivat sen web-käyttöliittymän hyvin nopeasti pois saatavilta, kirjoittaa The Register.

Syynä olivat paitsi käyttäjäkunnan kasvun aiheuttamat serverikulut myös se, että Alpacaan ei ollut sisäänrakennettu samanlaisia estoja ja turvaominaisuuksia kuin vähemmän kotikutoisiin kielimalleihin. Muiden kielimallien tapaan Alpacalla oli tapana esimerkiksi ”hallusinoida” säännöllisesti täysin päätöntä mutta vakuuttavan kuuloista valetietoa. Se myös suolsi myös rasistista ja muuten loukkaavaa kielenkäyttöä.

Aiemmin asiasta kirjoittanut New Atlas huomauttaa, että sittemmin julkaistu GPT 4.0 on vastaavanlaiseen kokeeseen entistä tehokkaampi. Pohjaksi voisi ottaa myös laajemman LLaMA-mallin ja generoida enemmän kuin 52 000 koulutuskysymystä.

ChatGPT:n kehittäjä OpenAI kieltää ChatGPT:n käyttämisen kilpailevien palveluiden kehittämiseen, ja Metan käyttöehdot puolestaan kieltävät LLaMA-kielimallien käytön muille kuin tutkijoille ja ei-kaupalliseen käyttöön. Tällaisista asioista rikolliset kuitenkaan tuskin välittävät, New Atlas huomauttaa.

Muut kehittäjät saivat Alpacan pian pyörimään niin Raspberry Pi -koneilla kuin Pixel 6 -puhelimillakin. Näin ollen serverikuluistakaan ei tarvitse juuri huolehtia, mikäli epämääräinen taho haluaisi kehittää itse omaan käyttöönsä optimoidun tekoälyalgoritmin luomaan esimerkiksi poliittista valetietoa tai huijausviestejä.

LUE MYÖS

Lähde

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *