GPT-3.5, GPT-4: เรียนรู้ความแตกต่าง
ChatGPT เป็นแอปพลิเคชั่นแชทบอทที่พัฒนาโดย OpenAI GPT เวอร์ชันต่างๆ (เช่น GPT-3.5 และ GPT-4) คือ "สมอง" ของแชทบอท ซึ่งเป็นปัญญาประดิษฐ์ที่ช่วยให้ ChatGPT จดจำ เข้าใจ และสร้างข้อความในลักษณะเหมือนมนุษย์
GPT-3.5
GPT-3.5 เป็นคลาสย่อยของการทำซ้ำครั้งที่ 3 ของ Generative Pre-Trained Transformer เป็นโมเดลภาษาขนาดใหญ่ที่ใช้สถาปัตยกรรมหม้อแปลงไฟฟ้าที่ได้รับการฝึกอบรมเกี่ยวกับข้อมูลข้อความจำนวนมหาศาลเพื่อทำความเข้าใจและตอบสนองในภาษาธรรมชาติ (เช่น ไทย อังกฤษ สเปน ฝรั่งเศส ฯลฯ) นั่นเรียกว่าการประมวลผลภาษาธรรมชาติ สถาปัตยกรรมหม้อแปลงไฟฟ้ามีความก้าวหน้ามากกว่าสถาปัตยกรรมประสาทที่เกิดซ้ำก่อนหน้านี้ พูดง่ายๆ ก็คือช่วยให้โมเดลภาษาเข้าใจและเข้าใจข้อความได้ดีขึ้น
ทรานส์ฟอร์มเมอร์สามารถเข้าใจบริบทได้ดีขึ้น รับรู้ความเชื่อมโยงระหว่างคำในประโยคและย่อหน้า และเน้นย้ำแนวคิดหลักภายในข้อความ
GPT-3.5 มีพารามิเตอร์การเรียนรู้ 175 พันล้านพารามิเตอร์ ในช่วงเวลานี้ถือเป็นรูปแบบภาษาขนาดใหญ่อื่นๆ มากที่สุด พารามิเตอร์เหล่านี้เหมือนกับการเชื่อมต่อทางประสาท ยิ่งมากยิ่งดี สิ่งที่น่าประหลาดใจที่สุดคือ ณ จุดหนึ่ง เมื่อจำนวนพารามิเตอร์เพิ่มขึ้น โมเดลจะกลายเป็นผู้เชี่ยวชาญแม้ในด้านที่ไม่มีใครฝึกฝนเป็นพิเศษ เช่น การแปลจากภาษาหนึ่งเป็นอีกภาษาหนึ่ง การแก้ปัญหาเชิงตรรกะและคณิตศาสตร์ เป็นต้น
เพื่อให้การโต้ตอบกับ GPT-3.5 เป็นธรรมชาติและปลอดภัยยิ่งขึ้น จึงมีการใช้เทคนิคที่เรียกว่าการเรียนรู้แบบเสริมกำลังจากการตอบสนองของมนุษย์ โดยที่ข้อมูลของมนุษย์จะถูกนำมาใช้เพื่อปรับปรุงอัลกอริทึมของแมชชีนเลิร์นนิง
ChatGPT-4 และความแตกต่างจาก ChatGPT-3.5 อย่างไร
GPT-4 มีพารามิเตอร์ 100 ล้านล้าน!
รุ่นใหม่ล้ำหน้ากว่าหลายเท่า ความแตกต่างที่สำคัญประการหนึ่งที่ดึงดูดสายตาคุณทันทีคือ GPT-4 ได้เรียนรู้ที่จะจดจำภาพ นี่คือสิ่งที่สามารถทำได้:
- อธิบายสิ่งที่อยู่ในภาพ
- อธิบายเรื่องตลกด้วยภาพ
- คิดคำบรรยายภาพ
- แนะนำสูตรอาหารตามอาหารในภาพ
- เข้าใจกราฟ แผนภูมิ และข้อความที่เขียนด้วยลายมือ
ตัวอย่างเช่น GPT-4 สามารถเขียนโค้ดสำหรับหน้าเว็บที่คุณต้องการสร้างโดยใช้เทมเพลตที่วาดด้วยมือ
GPT-4 ยังประมวลผลข้อมูลที่เป็นข้อความได้ดีกว่ารุ่นก่อน โดยจะจดจำข้อความจำนวนมากเพื่อความเข้าใจตามบริบทที่ดีขึ้น และให้คำตอบที่แม่นยำยิ่งขึ้น 40% GPT-4 สามารถประมวลผลข้อความได้เทียบเท่ากับ 300 หน้า (โทเค็น 128,000 รายการ) ในข้อความแจ้งเดียว ในขณะที่ GPT-3.5 สามารถประมวลผลได้เพียง 14 หน้า (โทเค็น 16,000 รายการ)
GPT-4 ฉลาดมากจนผ่านการทดสอบเนติบัณฑิต โดยอยู่ใน 10% แรก (GPT-3.5 ตามมาด้วยมนุษย์ประมาณ 17%) ในการทดสอบหลายๆ ครั้ง โมเดลนี้มีประสิทธิภาพเหนือกว่าแม้แต่มนุษย์ โดยเฉพาะในการทดสอบคณิตศาสตร์ ฟิสิกส์ และเคมี GPT-4 ทำได้ดีกว่าผู้สอบถึง 88%
GPT-3.5 | GPT-4 | |
วันที่วางจำหน่ายครั้งแรก | 15 มีนาคม 2022 | 14 มีนาคม 2023 |
ความรู้เหตุการณ์โลก | จนถึงเดือนกันยายน 2021 | จนถึงเดือนเมษายน 2023 |
พารามิเตอร์ | 175 พันล้าน | 100 ล้านล้าน |
ป้อนข้อมูล | ข้อความเท่านั้น | ข้อความและรูปภาพ |
หน้าต่างบริบท | 16,000 โทเค็น* | 128,000 โทเค็น* |
การตอบสนองตามข้อเท็จจริง | ข้อผิดพลาดเป็นครั้งคราว | แม่นยำมากขึ้น 40% |
*1,000 โทเค็นมีประมาณ 750 คำ
GPT-4 มีประสิทธิภาพเหนือกว่า GPT-3.5 ในด้านต่างๆ มากมาย ตั้งแต่การแต่งเพลงและการเขียนบทไปจนถึงการเขียนเชิงเทคนิคและการแปลภาษา
การวิจารณ์ GPT-4
GPT-4 ไม่ได้สมบูรณ์แบบ แต่อย่างใด สำหรับเราดูเหมือนว่าโครงข่ายประสาทเทียมจะดีขึ้นทุกวันเท่านั้น แต่การศึกษาจากมหาวิทยาลัยสแตนฟอร์ดในเดือนมิถุนายน 2023 แสดงให้เห็นว่าผลลัพธ์ของ GPT-4 ลดลงตั้งแต่เดือนมีนาคม
การทดสอบ GPT-4 และ GPT-3.5 ในเดือนมีนาคมและมิถุนายน 2023
แบบจำลองนี้แสดงให้เห็นประสิทธิภาพที่ลดลงอย่างมากในการแก้ปัญหาทางคณิตศาสตร์และการสร้างโค้ด:
- ตัวอย่างเช่น มีปัญหาในการระบุว่าหมายเลข 17077 เป็นจำนวนเฉพาะหรือไม่
- และมีเพียง 10% เท่านั้นที่สามารถเขียนโค้ดการทำงานในงานที่ LeetCode จัดว่าง่ายได้
ในเวลาเดียวกัน GPT-4 แสดงให้เห็นการปรับปรุงในด้านการใช้เหตุผลด้วยภาพและการตอบคำถามที่ละเอียดอ่อน (ซึ่งคำตอบอาจก่อให้เกิดอันตรายหรือฝ่าฝืนกฎหมาย)
นักวิจารณ์ของการศึกษาครั้งนี้ชี้ให้เห็นข้อผิดพลาดที่เป็นไปได้ในระเบียบวิธีและตั้งข้อสังเกตว่าพลวัตที่เกิดขึ้นควรถูกมองว่าเป็นการเปลี่ยนแปลงพฤติกรรมมากกว่าการเสื่อมสภาพ