GPT-3.5, GPT-4: เรียนรู้ความแตกต่าง

ChatGPT เป็นแอปพลิเคชั่นแชทบอทที่พัฒนาโดย OpenAI GPT เวอร์ชันต่างๆ (เช่น GPT-3.5 และ GPT-4) คือ "สมอง" ของแชทบอท ซึ่งเป็นปัญญาประดิษฐ์ที่ช่วยให้ ChatGPT จดจำ เข้าใจ และสร้างข้อความในลักษณะเหมือนมนุษย์

GPT-3.5

GPT-3.5 เป็นคลาสย่อยของการทำซ้ำครั้งที่ 3 ของ Generative Pre-Trained Transformer เป็นโมเดลภาษาขนาดใหญ่ที่ใช้สถาปัตยกรรมหม้อแปลงไฟฟ้าที่ได้รับการฝึกอบรมเกี่ยวกับข้อมูลข้อความจำนวนมหาศาลเพื่อทำความเข้าใจและตอบสนองในภาษาธรรมชาติ (เช่น ไทย อังกฤษ สเปน ฝรั่งเศส ฯลฯ) นั่นเรียกว่าการประมวลผลภาษาธรรมชาติ สถาปัตยกรรมหม้อแปลงไฟฟ้ามีความก้าวหน้ามากกว่าสถาปัตยกรรมประสาทที่เกิดซ้ำก่อนหน้านี้ พูดง่ายๆ ก็คือช่วยให้โมเดลภาษาเข้าใจและเข้าใจข้อความได้ดีขึ้น

ทรานส์ฟอร์มเมอร์สามารถเข้าใจบริบทได้ดีขึ้น รับรู้ความเชื่อมโยงระหว่างคำในประโยคและย่อหน้า และเน้นย้ำแนวคิดหลักภายในข้อความ

GPT-3.5 มีพารามิเตอร์การเรียนรู้ 175 พันล้านพารามิเตอร์ ในช่วงเวลานี้ถือเป็นรูปแบบภาษาขนาดใหญ่อื่นๆ มากที่สุด พารามิเตอร์เหล่านี้เหมือนกับการเชื่อมต่อทางประสาท ยิ่งมากยิ่งดี สิ่งที่น่าประหลาดใจที่สุดคือ ณ จุดหนึ่ง เมื่อจำนวนพารามิเตอร์เพิ่มขึ้น โมเดลจะกลายเป็นผู้เชี่ยวชาญแม้ในด้านที่ไม่มีใครฝึกฝนเป็นพิเศษ เช่น การแปลจากภาษาหนึ่งเป็นอีกภาษาหนึ่ง การแก้ปัญหาเชิงตรรกะและคณิตศาสตร์ เป็นต้น

เพื่อให้การโต้ตอบกับ GPT-3.5 เป็นธรรมชาติและปลอดภัยยิ่งขึ้น จึงมีการใช้เทคนิคที่เรียกว่าการเรียนรู้แบบเสริมกำลังจากการตอบสนองของมนุษย์ โดยที่ข้อมูลของมนุษย์จะถูกนำมาใช้เพื่อปรับปรุงอัลกอริทึมของแมชชีนเลิร์นนิง

ChatGPT-4 และความแตกต่างจาก ChatGPT-3.5 อย่างไร

GPT-4 มีพารามิเตอร์ 100 ล้านล้าน!

รุ่นใหม่ล้ำหน้ากว่าหลายเท่า ความแตกต่างที่สำคัญประการหนึ่งที่ดึงดูดสายตาคุณทันทีคือ GPT-4 ได้เรียนรู้ที่จะจดจำภาพ นี่คือสิ่งที่สามารถทำได้:

อธิบายสิ่งที่อยู่ในภาพ
อธิบายเรื่องตลกด้วยภาพ
คิดคำบรรยายภาพ
แนะนำสูตรอาหารตามอาหารในภาพ
เข้าใจกราฟ แผนภูมิ และข้อความที่เขียนด้วยลายมือ

ตัวอย่างเช่น GPT-4 สามารถเขียนโค้ดสำหรับหน้าเว็บที่คุณต้องการสร้างโดยใช้เทมเพลตที่วาดด้วยมือ

GPT-4 ยังประมวลผลข้อมูลที่เป็นข้อความได้ดีกว่ารุ่นก่อน โดยจะจดจำข้อความจำนวนมากเพื่อความเข้าใจตามบริบทที่ดีขึ้น และให้คำตอบที่แม่นยำยิ่งขึ้น 40% GPT-4 สามารถประมวลผลข้อความได้เทียบเท่ากับ 300 หน้า (โทเค็น 128,000 รายการ) ในข้อความแจ้งเดียว ในขณะที่ GPT-3.5 สามารถประมวลผลได้เพียง 14 หน้า (โทเค็น 16,000 รายการ)

GPT-4 ฉลาดมากจนผ่านการทดสอบเนติบัณฑิต โดยอยู่ใน 10% แรก (GPT-3.5 ตามมาด้วยมนุษย์ประมาณ 17%) ในการทดสอบหลายๆ ครั้ง โมเดลนี้มีประสิทธิภาพเหนือกว่าแม้แต่มนุษย์ โดยเฉพาะในการทดสอบคณิตศาสตร์ ฟิสิกส์ และเคมี GPT-4 ทำได้ดีกว่าผู้สอบถึง 88%

	GPT-3.5	GPT-4
วันที่วางจำหน่ายครั้งแรก	15 มีนาคม 2022	14 มีนาคม 2023
ความรู้เหตุการณ์โลก	จนถึงเดือนกันยายน 2021	จนถึงเดือนเมษายน 2023
พารามิเตอร์	175 พันล้าน	100 ล้านล้าน
ป้อนข้อมูล	ข้อความเท่านั้น	ข้อความและรูปภาพ
หน้าต่างบริบท	16,000 โทเค็น*	128,000 โทเค็น*
การตอบสนองตามข้อเท็จจริง	ข้อผิดพลาดเป็นครั้งคราว	แม่นยำมากขึ้น 40%

*1,000 โทเค็นมีประมาณ 750 คำ

GPT-4 มีประสิทธิภาพเหนือกว่า GPT-3.5 ในด้านต่างๆ มากมาย ตั้งแต่การแต่งเพลงและการเขียนบทไปจนถึงการเขียนเชิงเทคนิคและการแปลภาษา

การวิจารณ์ GPT-4

GPT-4 ไม่ได้สมบูรณ์แบบ แต่อย่างใด สำหรับเราดูเหมือนว่าโครงข่ายประสาทเทียมจะดีขึ้นทุกวันเท่านั้น แต่การศึกษาจากมหาวิทยาลัยสแตนฟอร์ดในเดือนมิถุนายน 2023 แสดงให้เห็นว่าผลลัพธ์ของ GPT-4 ลดลงตั้งแต่เดือนมีนาคม

การทดสอบ GPT-4 และ GPT-3.5 ในเดือนมีนาคมและมิถุนายน 2023

แบบจำลองนี้แสดงให้เห็นประสิทธิภาพที่ลดลงอย่างมากในการแก้ปัญหาทางคณิตศาสตร์และการสร้างโค้ด:

ตัวอย่างเช่น มีปัญหาในการระบุว่าหมายเลข 17077 เป็นจำนวนเฉพาะหรือไม่
และมีเพียง 10% เท่านั้นที่สามารถเขียนโค้ดการทำงานในงานที่ LeetCode จัดว่าง่ายได้

ในเวลาเดียวกัน GPT-4 แสดงให้เห็นการปรับปรุงในด้านการใช้เหตุผลด้วยภาพและการตอบคำถามที่ละเอียดอ่อน (ซึ่งคำตอบอาจก่อให้เกิดอันตรายหรือฝ่าฝืนกฎหมาย)

นักวิจารณ์ของการศึกษาครั้งนี้ชี้ให้เห็นข้อผิดพลาดที่เป็นไปได้ในระเบียบวิธีและตั้งข้อสังเกตว่าพลวัตที่เกิดขึ้นควรถูกมองว่าเป็นการเปลี่ยนแปลงพฤติกรรมมากกว่าการเสื่อมสภาพ