GPT-3.5, GPT-4: Научете каква е разликата
ChatGPT е приложение за чатбот, разработено от OpenAI. Различните версии на GPT (като GPT-3.5 и GPT-4) са "мозъците" на чатбота - изкуственият интелект, който позволява на ChatGPT да разпознава, разбира и генерира текст по начин, подобен на човешкия.
GPT-3.5
GPT-3.5 е подклас на третата итерация на Generative Pre-Trained Transformer. Това е голям езиков модел, базиран на архитектурата на трансформатора, който е обучен върху огромни количества текстови данни, за да разбира и отговаря на естествени езици (като български, английски, испански, френски и др.). Това се нарича обработка на естествен език. Трансформаторната архитектура е по-усъвършенствана от предишната рекурентна невронна архитектура. С прости думи, тя помага на езиковия модел да разбере и възприеме по-добре текста.
Трасформаторите са в състояние да разбират по-добре контекста, да възприемат връзките между думите в изречението и параграфа и да акцентират върху ключовите идеи в текста.
GPT-3.5 има 175 милиарда параметри за обучение. По онова време това беше най-големият брой от всички други големи езикови модели. Тези параметри са като невронните връзки - колкото повече, толкова по-добре. Най-изненадващото е, че в един момент, когато броят на параметрите се увеличи, моделът става експерт дори в области, за които никой не го е обучавал специално: например превод от един език на друг, решаване на логически и математически задачи.
За да се направи взаимодействието с GPT-3.5 по-естествено и по-безопасно, беше приложена техника, наречена усилено обучение от човешка обратна връзка, при която човешкият принос се използва за подобряване на алгоритмите за машинно обучение.
ChatGPT-4 и по какво се различава от ChatGPT-3.5
GPT-4 има 100 трилиона параметри!
Новият модел е многократно по-усъвършенстван. Една от важните разлики, която веднага се набива на очи, е, че GPT-4 се е научил да разпознава изображения. Ето какво може да прави:
- описва какво има на снимката,
- да обяснява визуални шеги,
- да измисли надпис за снимка,
- да предложи рецепта въз основа на храната на снимката,
- да разбира графики, диаграми и ръкописен текст.
Например, въз основа на ръчно нарисуван шаблон, GPT-4 може да напише кода за уеб страницата, която искате да създадете.
GPT-4 се справя по-добре от своя предшественик и с обработката на текстова информация: той запомня големи количества текст за по-добро разбиране на контекста и дава 40% по-точни отговори. GPT-4 може да обработи текст, еквивалентен на 300 страници (128 000 токена), в рамките на едно запитване, докато GPT-3.5 може да обработи само 14 страници (16 000 токена).
GPT-4 е толкова интелигентен, че успешно издържа изпита за юристи, като се класира в първите 10% (GPT-3.5 изостава от хората с около 17%). В много тестове моделът превъзхожда дори хората. По-конкретно, в тестовете по математика, физика и химия GPT-4 превъзхожда 88 % от участниците в изпита.
GPT-3.5 | GPT-4 | |
Първоначална дата на пускане | 15 март 2022 г. | 14 март 2023 г. |
Познаване на световните събития | До септември 2021 г. | До април 2023 г. |
Параметри | 175 млрд. | 100 трилиона |
Входни данни | Само с текст | Текст и изображения |
Контекстен прозорец | 16 000 токена* | 128 000 токена* |
Фактически отговори | Случайни грешки | 40% по-точно |
*1000 токена са около 750 думи
GPT-4 превъзхожда GPT-3.5 в много различни области: от писане на песни и сценарии до техническо писане и езикови преводи.
Критика към GPT-4
GPT-4 в никакъв случай не е съвършен. Струва ни се, че невронните мрежи стават все по-добри с всеки изминал ден, но проучване от Станфорд от юни 2023 г. показва, че резултатите на GPT-4 са се влошили от март насам.
Тестване на GPT-4 и GPT-3.5 през март и юни 2023 г.
Моделът показа значително намаляване на производителността при решаването на математически задачи и генерирането на код:
- например, той се затрудни да определи дали числото 17077 е просто,
- и само в 10% от случаите успяваше да напише работещ код в задачи, класифицирани като лесни от LeetCode.
В същото време GPT-4 показа подобрения във визуалното мислене и отговарянето на чувствителни въпроси (когато отговорът може да причини вреда или да наруши закона).
Критиците на това изследване посочиха възможни грешки в методологията и отбелязаха, че получената динамика трябва да се разглежда по-скоро като промяна в поведението, отколкото като влошаване.