กลับสู่หน้าหลัก

ทำความเข้าใจการตั้งค่า ChatGPT: อุณหภูมิ, Top P, Presence penalty และ Frequency penalty

ตัวเลือกความยืดหยุ่นและการปรับแต่งที่นำเสนอโดยพารามิเตอร์ของ ChatGPT ทำให้เป็นเครื่องมืออเนกประสงค์สำหรับงานต่างๆ ด้วยการปรับพารามิเตอร์ เช่น อุณหภูมิ Top P Presence penalty และ Frequency penalty ผู้ใช้สามารถปรับเอาต์พุตของโมเดลอย่างละเอียดเพื่อให้เหมาะกับความต้องการเฉพาะของตนเอง ไม่ว่าจะเป็นการเขียนเชิงสร้างสรรค์ การสร้างคำตอบที่ถูกต้อง หรือการกำหนดรูปแบบภาษาของโมเดล การทำความเข้าใจและการใช้พารามิเตอร์เหล่านี้สามารถปรับปรุงอรรถประโยชน์และประสิทธิผลของ ChatGPT ได้อย่างมาก

การตั้งค่า ChatGPT

การตั้งค่า ChatGPT

อุณหภูมิ

อุณหภูมิจะควบคุมความสุ่มของการตอบสนองที่สร้างขึ้น ค่าอุณหภูมิที่สูงขึ้นจะเพิ่มการสุ่ม ทำให้การตอบสนองมีความหลากหลายและสร้างสรรค์มากขึ้น ในขณะที่ค่าที่ต่ำกว่าจะทำให้การตอบสนองมีสมาธิและตัดสินใจได้มากขึ้น

สำหรับงานเขียนเชิงสร้างสรรค์หรือการระดมความคิด มักใช้ค่าอุณหภูมิที่สูงกว่า (เช่น 0.8-1.0) เพื่อสำรวจความเป็นไปได้ต่างๆ ในทางกลับกัน สำหรับการสืบค้นตามข้อเท็จจริงหรือเมื่อสร้างคำตอบที่แม่นยำ ควรใช้ค่าอุณหภูมิที่ต่ำกว่า (เช่น 0.2-0.5) เพื่อให้มั่นใจว่าคำตอบถูกต้องและเชื่อถือได้มากขึ้น

Top P

พารามิเตอร์ Top P ควบคุมความหลากหลายของเอาต์พุตที่สร้างขึ้นโดยการตัดทอนการกระจายความน่าจะเป็นของคำ โดยทำหน้าที่เป็นตัวกรองเพื่อกำหนดจำนวนคำหรือวลีที่โมเดลภาษาตรวจสอบขณะคาดเดาคำถัดไป ตัวอย่างเช่น เมื่อตั้งค่า Top P ไว้ที่ 0.4 โมเดลจะพิจารณาเพียง 40% ของคำหรือวลีที่เป็นไปได้มากที่สุด

การตั้งค่า Top P ที่สูงขึ้น (เช่น 0.9-1.0) ช่วยให้มั่นใจได้ถึงตัวเลือกที่หลากหลายมากขึ้น ส่งผลให้ได้รับการตอบสนองที่หลากหลายมากขึ้น สิ่งนี้มีประโยชน์สำหรับงานสร้างสรรค์ที่ต้องการความแปลกใหม่ ในทางกลับกัน ค่า Top P ที่ต่ำกว่า (เช่น 0.1-0.5) จะจำกัดตัวเลือกให้เหลือเพียงค่าที่เป็นไปได้มากที่สุด ทำให้การตอบสนองมีความเข้มข้นและสอดคล้องกันมากขึ้น

อุณหภูมิและ Top P แตกต่างกันอย่างไร?

Top P กำหนดช่วงของโทเค็น (คำและสัญลักษณ์) ที่ ChatGPT สามารถใช้ได้ เมื่อ Top P = 1 โมเดลภาษาจะสามารถใช้โทเค็นใดก็ได้ในขณะที่สร้างการตอบกลับ เมื่อ Top P = 0.5 จะสามารถใช้ได้เพียง 50% ของตัวเลือกที่น่าจะเป็น/เหมาะสม/ทั่วไปที่สุดเท่านั้น

ในทางกลับกัน อุณหภูมิจะกำหนดโอกาสที่ ChatGPT จะเลือกโทเค็นเฉพาะ ด้วยอุณหภูมิ 1 บอทจะมีความน่าจะเป็นเท่ากันสำหรับตัวเลือกที่มีอยู่ทั้งหมด (ภายในขอบเขต Top P) ในขณะที่ค่าที่ต่ำกว่าจะทำให้บอทเอนเอียงไปทางคำและวลีที่ใช้บ่อยมากขึ้น

ค่าที่เหมาะสมที่สุดสำหรับอุณหภูมิและ Top P

อุณหภูมิและค่า Top P ที่ดีที่สุดสำหรับงานที่แตกต่างกันอาจแตกต่างกันไป ขึ้นอยู่กับข้อกำหนดและความชอบเฉพาะของลูกค้าหรือสิ่งพิมพ์

  • สำหรับการเขียนบทความ ค่าอุณหภูมิที่ต่ำกว่า (เช่น ประมาณ 0.5-0.7) และค่า Top P ปานกลางถึงสูง (เช่น ประมาณ 0.8-0.9) สามารถช่วยสร้างบทความที่เน้นและสอดคล้องกันมากขึ้น ในขณะที่ยังคงเปิดรับข้อมูลจากปัญญาประดิษฐ์บางส่วน แบบอย่าง
  • สำหรับคำอธิบายผลิตภัณฑ์ ค่าอุณหภูมิที่สูงขึ้นเล็กน้อย (เช่น ประมาณ 0.7-0.8) และค่า Top P ปานกลาง (เช่น ประมาณ 0.7-0.8) สามารถช่วยสร้างคำอธิบายที่ไม่ซ้ำใครและน่าดึงดูดที่โดดเด่นสำหรับผู้มีโอกาสเป็นลูกค้า
  • สำหรับการแปลภาษา ค่าอุณหภูมิที่ต่ำกว่า (เช่น ประมาณ 0.5-0.7) และค่า Top P ปานกลางถึงสูง (เช่น ประมาณ 0.8-0.9) สามารถช่วยรับประกันการแปลที่แม่นยำในขณะที่ยังคงรักษาเอาต์พุตที่ฟังดูเป็นธรรมชาติ
  • สำหรับงานผู้ช่วยเสมือน ค่าอุณหภูมิปานกลาง (เช่น ประมาณ 0.7-0.8) และค่า Top P ปานกลางถึงสูง (เช่น ประมาณ 0.8-0.9) สามารถช่วยสร้างการตอบสนองแบบโต้ตอบและเป็นประโยชน์ซึ่งมีทั้งข้อมูลและการมีส่วนร่วม
  • สำหรับการดูแลจัดการเนื้อหา ค่าอุณหภูมิที่สูงขึ้น (เช่น ประมาณ 0.8-0.9) และค่า Top P ต่ำ (เช่น ประมาณ 0.2-0.4) จะช่วยให้มีความคิดสร้างสรรค์และความหลากหลายมากขึ้นในเนื้อหาที่ดูแลจัดการ ในขณะที่ยังคงรักษาความเกี่ยวข้องและคุณภาพไว้
  • งานสร้างโค้ดจำเป็นต้องมีความแม่นยำและการปฏิบัติตามแบบแผน การตั้งค่าอุณหภูมิต่ำระหว่าง 0.1 ถึง 0.5 สามารถช่วยรับประกันการสร้างโค้ดที่แม่นยำและปราศจากข้อผิดพลาด ขอแนะนำให้ใช้ค่า Top P ที่ต่ำกว่าประมาณ 0.2 เพื่อลดความสุ่มให้เหลือน้อยที่สุด และรักษาความสอดคล้องกับแบบแผนที่กำหนดไว้

Presence penalty

ทั้ง Presence penalty และ Frequency penalty ช่วยหลีกเลี่ยงการเกิดซ้ำ พวกเขาทั้งสองลงโทษการใช้คำเดียวกันซ้ำแล้วซ้ำเล่า แต่ในรูปแบบที่แตกต่างกันเล็กน้อย Presence penalty จะลงโทษโทเค็นโดยพิจารณาว่าโทเค็นเหล่านั้นปรากฏในข้อความที่สร้างขึ้นหรือไม่ โดยไม่คำนึงว่าจะเกิดขึ้นบ่อยแค่ไหน

สิ่งนี้กระตุ้นให้ ChatGPT ใช้คำศัพท์ที่หลากหลายมากขึ้น ยิ่งค่า Presence penalty สูง บทลงโทษก็จะยิ่งเด่นชัดมากขึ้น

Frequency penalty

Frequency penalty จะลงโทษโทเค็นโดยพิจารณาจากความถี่ที่โทเค็นปรากฏในข้อความจนถึงตอนนี้ หากคุณสังเกตเห็นการใช้คำเดียวกันมากเกินไปในผลลัพธ์ที่สร้างขึ้น คุณอาจต้องการเพิ่มค่าของพารามิเตอร์นี้

การเพิ่มการแสดงตน_บทลงโทษก็เหมือนกับการบอก ChatGPT ว่าอย่าใช้วลีหรือแนวคิดซ้ำๆ ในขณะที่การเพิ่มความถี่_บทลงโทษก็เหมือนกับการบอกไม่ให้ใช้คำเดียวกันบ่อยเกินไป

ค่าที่เหมาะสมที่สุดสำหรับ Presence penalty และ Frequency penalty

เพื่อวัตถุประสงค์ในการลดตัวอย่างที่ซ้ำกันในระดับปานกลาง ค่าสัมประสิทธิ์การลงโทษที่เหมาะสมโดยทั่วไปจะอยู่ในช่วงตั้งแต่ 0.1 ถึง 1 อย่างไรก็ตาม หากเป้าหมายคือการระงับการทำซ้ำอย่างมีนัยสำคัญ ค่าสัมประสิทธิ์จะเพิ่มขึ้นเป็น 2

อย่างไรก็ตาม สิ่งสำคัญคือต้องทราบว่าการเพิ่มขึ้นนี้อาจส่งผลให้คุณภาพตัวอย่างลดลงอย่างเห็นได้ชัด หรืออาจใช้ค่าลบเพื่อเพิ่มโอกาสในการเกิดซ้ำโดยเจตนาก็ได้