GPT-3.5, GPT-4: Opi eroavaisuus
ChatGPT on OpenAI:n kehittämä chatbot-sovellus. GPT:n eri versiot (kuten GPT-3.5 ja GPT-4) ovat chatbotin "aivot" eli tekoäly, jonka avulla ChatGPT tunnistaa, ymmärtää ja tuottaa tekstiä ihmisen kaltaisella tavalla.
GPT-3.5
GPT-3.5 on Generative Pre-Trained Transformerin kolmannen iteraation aliluokka. Se on suuri kielimalli, joka perustuu transformer-arkkitehtuuriin ja joka on koulutettu valtavilla määrillä tekstidataa ymmärtämään ja vastaamaan luonnollisiin kieliin (kuten suomi, englanti, espanja, ranska jne.). Tätä kutsutaan luonnollisen kielen käsittelyksi. Muuntajaarkkitehtuuri on edistyneempi kuin aiempi rekursiivinen neuroarkkitehtuuri. Yksinkertaisesti sanottuna se auttaa kielimallia ymmärtämään ja hahmottamaan tekstiä paremmin.
Muuntajat kykenevät ymmärtämään paremmin asiayhteyden, hahmottamaan lauseen ja kappaleen sanojen välisiä yhteyksiä ja korostamaan tekstin keskeisiä ajatuksia.
GPT-3.5:ssä on 175 miljardia oppimisparametria. Se oli tuolloin suurin minkään muun suuren kielimallin parametrien määrä. Nämä parametrit ovat kuin hermoyhteyksiä, mitä enemmän, sitä parempi. Yllättävintä on se, että kun parametrien määrä kasvaa, mallista tulee jossain vaiheessa asiantuntija myös sellaisilla aloilla, joihin sitä ei ole erityisesti koulutettu: esimerkiksi kääntäminen kielestä toiseen ja loogisten ja matemaattisten ongelmien ratkaiseminen.
Jotta vuorovaikutus GPT-3.5:n kanssa olisi luonnollisempaa ja turvallisempaa, käytettiin tekniikkaa, jota kutsutaan ihmispalautteesta oppimiseksi ja jossa ihmisen antamaa palautetta käytetään koneoppimisalgoritmien parantamiseen.
ChatGPT-4 ja miten se eroaa ChatGPT-3.5:stä?
GPT-4:ssä on 100 biljoonaa parametria!
Uusi malli on monta kertaa kehittyneempi. Yksi tärkeä ero, joka pistää heti silmään, on se, että GPT-4 on oppinut tunnistamaan kuvia. Näin se osaa tehdä:
- kuvata, mitä kuvassa on,
- selittää visuaalisia vitsejä,
- keksiä kuvatekstin valokuvalle,
- ehdottaa reseptiä kuvan ruoan perusteella,
- ymmärtää kaavioita, taulukoita ja käsinkirjoitettua tekstiä.
Esimerkiksi käsin piirretyn mallin perusteella GPT-4 voi kirjoittaa haluamasi verkkosivun koodin.
GPT-4 on edeltäjäänsä parempi myös tekstimuotoisen tiedon käsittelyssä: se muistaa suuria määriä tekstiä, mikä parantaa kontekstin ymmärtämistä, ja antaa 40 prosenttia tarkempia vastauksia. GPT-4 pystyy käsittelemään 300 sivua tekstiä (128 000 tokenia) vastaavan määrän tekstiä yhdessä kysymyksessä, kun taas GPT-3.5 pystyi käsittelemään vain 14 sivua (16 000 tokenia).
GPT-4 on niin älykäs, että se läpäisi asianajajatutkinnon ja sijoittui 10 prosentin kärkijoukkoon (GPT-3.5 jäi ihmisistä noin 17 prosenttia). Monissa testeissä malli päihitti jopa ihmisen. Erityisesti matematiikan, fysiikan ja kemian kokeissa GPT-4 päihitti 88 prosenttia kokelaista.
GPT-3.5 | GPT-4 | |
Alkuperäinen julkaisupäivä | 15. maaliskuuta 2022 | 14. maaliskuuta 2023 |
Maailman tapahtumien tuntemus | Syyskuuhun 2021 asti | Huhtikuuhun 2023 asti |
Parametrit | 175 miljardia | 100 biljoonaa |
Tulo | Vain teksti | Teksti ja kuvat |
Konteksti-ikkuna | 16 000 tokenia* | 128 000 tokenia* |
Tosiasiapohjaiset vastaukset | Satunnaisia virheitä | 40 % tarkempi |
*1000 tokenia on noin 750 sanaa
GPT-4 päihittää GPT-3.5:n monilla eri aloilla: laulujen ja käsikirjoitusten kirjoittamisesta tekniseen kirjoittamiseen ja kielikäännöksiin.
GPT-4 kritiikki
GPT-4 ei ole missään nimessä täydellinen. Meistä näyttää siltä, että neuroverkot vain paranevat päivä päivältä, mutta Stanfordissa kesäkuussa 2023 tehty tutkimus osoitti, että GPT-4:n tulokset ovat heikentyneet maaliskuusta.
GPT-4:n ja GPT-3.5:n testaus maaliskuussa ja kesäkuussa 2023
Malli osoitti huomattavaa suorituskyvyn heikkenemistä matemaattisten ongelmien ratkaisemisessa ja koodin luomisessa:
- sillä oli esimerkiksi vaikeuksia määrittää, oliko luku 17077 alkuluku,
- ja vain 10 prosenttia ajasta se pystyi kirjoittamaan toimivaa koodia tehtävissä, jotka LeetCode luokitteli helpoiksi.
Samaan aikaan GPT-4 osoitti parannuksia visuaalisessa päättelyssä ja arkaluonteisiin kysymyksiin vastaamisessa (joissa vastaus voi aiheuttaa vahinkoa tai rikkoa lakia).
Tutkimuksen arvostelijat huomauttivat mahdollisista virheistä metodologiassa ja totesivat, että tuloksena olevaa dynamiikkaa olisi pidettävä pikemminkin käyttäytymisen muutoksena kuin heikkenemisenä.