GPT-3.5, GPT-4: Ismerje meg a különbséget

A ChatGPT az OpenAI által kifejlesztett chatbot alkalmazás. A GPT különböző változatai (például a GPT-3.5 és a GPT-4) a chatbot "agyát", a mesterséges intelligenciát jelentik, amely lehetővé teszi, hogy a ChatGPT emberi módon felismerje, megértse és generálja a szöveget.

GPT-3.5

A GPT-3.5 a Generative Pre-Trained Transformer 3. iterációjának alosztálya. Ez egy nagyméretű, transzformátor architektúrán alapuló nyelvi modell, amelyet hatalmas mennyiségű szöveges adaton képeztek ki a természetes nyelvek (pl. magyar, angol, spanyol, francia stb.) megértésére és megválaszolására. Ezt nevezik természetes nyelvi feldolgozásnak. A transzformátor architektúra fejlettebb, mint a korábbi rekurrens neurális architektúra. Egyszerűen fogalmazva, segít a nyelvi modellnek jobban megérteni és felfogni a szöveget.

A transzformátorok képesek jobban megérteni a kontextust, érzékelni a szavak közötti kapcsolatokat egy mondatban és bekezdésben, és kiemelni a szövegben lévő kulcsgondolatokat.

A GPT-3.5 175 milliárd tanulási paramétert tartalmaz. Abban az időben ez volt a legtöbb bármely más nagy nyelvi modellnél. Ezek a paraméterek olyanok, mint az idegi kapcsolatok, minél több, annál jobb. A legmeglepőbb az, hogy egy bizonyos ponton, amikor a paraméterek száma nő, a modell olyan területeken is szakértővé válik, amelyekre senki sem képezte ki külön: például az egyik nyelvről a másikra való fordításban, logikai és matematikai problémák megoldásában.

A GPT-3.5-tel való interakció természetesebbé és biztonságosabbá tétele érdekében az emberi visszajelzésekből történő megerősítő tanulás technikáját alkalmazták, amely során az emberi inputot a gépi tanuló algoritmusok javítására használják fel.

ChatGPT-4 és miben különbözik a ChatGPT-3.5-től

A GPT-4 100 trillió paraméterrel rendelkezik!

Az új modell sokszorosan fejlettebb. Az egyik fontos különbség, ami azonnal szemet szúr, hogy a GPT-4 megtanult képeket felismerni. A következőkre képes:

leírja, hogy mi van a képen,
megmagyarázza a vizuális vicceket,
képaláírást talál ki egy fényképhez,
receptet javasol a képen látható étel alapján,
grafikonok, diagramok és kézzel írt szövegek megértése.

Például egy kézzel rajzolt sablon alapján a GPT-4 képes megírni a létrehozni kívánt weboldal kódját.

A GPT-4 a szöveges információk feldolgozásában is jobban teljesít elődjénél: a jobb kontextuális megértés érdekében nagy mennyiségű szöveget jegyez meg, és 40%-kal pontosabb válaszokat ad. A GPT-4 300 oldalnyi szövegnek (128 000 token) megfelelő mennyiségű szöveget képes feldolgozni egyetlen kérdezés során, míg a GPT-3.5 csak 14 oldalt (16 000 token) tudott feldolgozni.

A GPT-4 olyannyira okos, hogy az ügyvédi vizsgán is megfelelt, és az első 10%-ban végzett (a GPT-3.5 végül 17%-kal maradt le az emberek mögött). Számos tesztben a modell még az embereket is felülmúlta. Konkrétan a matematika, fizika és kémia tesztekben a GPT-4 a vizsgázók 88%-át múlta felül.

	GPT-3.5	GPT-4
Kezdeti megjelenési dátum	Március 15, 2022	Március 14, 2023
A világ eseményeinek ismerete	2021 szeptemberéig	2023 áprilisáig
Paraméterek	175 milliárd	100 billió
Bemenet	Csak szöveges	Szöveg és képek
Kontextus ablak	16 000 token*	128 000 token*
Tényszerű válaszok	Alkalmi hibák	40%-kal pontosabb

*1000 token körülbelül 750 szó

A GPT-4 számos területen felülmúlja a GPT-3.5-öt: a dalszerzéstől és a forgatókönyvírástól kezdve a műszaki íráson át a nyelvi fordításokig.

GPT-4 kritika

A GPT-4 semmiképpen sem tökéletes. Számunkra úgy tűnik, hogy a neurális hálózatok csak napról napra jobbak, de egy 2023 júniusában Stanfordban készült tanulmány szerint a GPT-4 eredményei március óta romlottak.

A GPT-4 és a GPT-3.5 tesztelése 2023 márciusában és júniusában

A modell jelentős teljesítménycsökkenést mutatott a matematikai feladatok megoldása és a kódgenerálás terén:

például nehezen tudta megállapítani, hogy a 17077-es szám prím-e,
és csak az esetek 10%-ában tudott működő kódot írni a LeetCode által könnyűnek minősített feladatokban.

Ugyanakkor a GPT-4 javulást mutatott a vizuális gondolkodásban és az érzékeny kérdések megválaszolásában (ahol a válasz kárt okozhat vagy törvényt sérthet).

A vizsgálat kritikusai rámutattak a módszertan lehetséges hibáira, és megjegyezték, hogy a kapott dinamikát inkább viselkedésváltozásnak, mint romlásnak kell tekinteni.