Memahami pengaturan ChatGPT: Suhu, Top P, Presence penalty dan Frequency penalty

Fleksibilitas dan opsi penyesuaian yang ditawarkan oleh parameter ChatGPT menjadikannya alat serbaguna untuk berbagai tugas. Dengan menyesuaikan parameter seperti Suhu, Top P, Presence penalty dan Frequency penalty, pengguna dapat menyempurnakan output model agar sesuai dengan kebutuhan spesifik mereka. Baik itu penulisan kreatif, menghasilkan jawaban yang akurat, atau membentuk gaya bahasa model, memahami dan memanfaatkan parameter-parameter ini dapat sangat meningkatkan kegunaan dan efektivitas ChatGPT.

Pengaturan ChatGPT

Suhu

Suhu mengontrol keacakan respons yang dihasilkan. Nilai suhu yang lebih tinggi meningkatkan keacakan, membuat respons menjadi lebih beragam dan kreatif, sementara nilai yang lebih rendah membuatnya lebih terfokus dan deterministik.

Untuk tugas menulis kreatif atau curah gagasan, nilai suhu yang lebih tinggi (misalnya, 0,8-1,0) sering kali lebih disukai untuk mengeksplorasi berbagai kemungkinan. Di sisi lain, untuk pertanyaan berbasis fakta atau ketika menghasilkan jawaban yang tepat, nilai suhu yang lebih rendah (misalnya, 0,2-0,5) lebih disukai untuk memastikan jawaban yang lebih akurat dan dapat diandalkan.

Top P

Parameter Top P mengontrol keragaman output yang dihasilkan dengan memotong distribusi probabilitas kata. Parameter ini berfungsi sebagai filter untuk menentukan jumlah kata atau frasa yang diperiksa oleh model bahasa saat memprediksi kata berikutnya. Misalnya, ketika nilai Top P ditetapkan pada 0.4, model hanya mempertimbangkan 40% dari kata atau frasa yang paling mungkin.

Menetapkan nilai Top P yang lebih tinggi (misalnya, 0,9-1,0) memastikan rentang pilihan yang lebih luas, sehingga menghasilkan respons yang lebih beragam. Hal ini dapat berguna untuk tugas-tugas kreatif yang menginginkan kebaruan. Sebaliknya, nilai Top P yang lebih rendah (misalnya, 0,1-0,5) membatasi pilihan pada pilihan yang paling mungkin, sehingga tanggapan lebih terfokus dan koheren.

Apa perbedaan antara Suhu dan Top P?

Top P mendefinisikan rentang token (kata dan simbol) yang dapat digunakan oleh ChatGPT. Ketika Top P = 1, model bahasa dapat menggunakan token apa pun saat menghasilkan respons. Ketika Top P = 0.5, model bahasa ini hanya dapat menggunakan 50% dari opsi yang paling mungkin/sesuai/umum.

Di sisi lain, temperatur menentukan kemungkinan ChatGPT memilih token tertentu. Dengan suhu 1, bot akan memiliki probabilitas yang sama untuk semua opsi yang tersedia (dalam batas Top P), sedangkan nilai yang lebih rendah akan membuatnya condong ke arah kata dan frasa yang lebih sering digunakan.

Nilai optimal untuk Suhu dan Top P

Nilai suhu dan Top P terbaik untuk tugas yang berbeda dapat bervariasi, tergantung pada persyaratan dan preferensi spesifik klien atau publikasi.

Untuk penulisan artikel, nilai suhu yang lebih rendah (misalnya, sekitar 0,5-0,7) dan nilai Top P sedang hingga tinggi (misalnya, sekitar 0,8-0,9) dapat membantu menghasilkan artikel yang lebih terfokus dan koheren, namun tetap memungkinkan adanya masukan kreatif dari model kecerdasan buatan.
Untuk deskripsi produk, nilai suhu yang sedikit lebih tinggi (misalnya, sekitar 0,7-0,8) dan nilai Top P sedang (misalnya, sekitar 0,7-0,8) dapat membantu menciptakan deskripsi yang unik dan menarik yang menonjol bagi calon pelanggan.
Untuk terjemahan bahasa, nilai suhu yang lebih rendah (misalnya, sekitar 0,5-0,7) dan nilai Top P sedang hingga tinggi (misalnya, sekitar 0,8-0,9) dapat membantu memastikan terjemahan yang akurat sambil mempertahankan output yang terdengar alami.
Untuk tugas asisten virtual, nilai suhu sedang (misalnya, sekitar 0,7-0,8) dan nilai Top P sedang hingga tinggi (misalnya, sekitar 0,8-0,9) dapat membantu menciptakan respons interaktif dan bermanfaat yang informatif dan menarik.
Untuk kurasi konten, nilai suhu yang lebih tinggi (misalnya, sekitar 0,8-0,9) dan nilai Top P yang rendah (misalnya, sekitar 0,2-0,4) dapat memungkinkan lebih banyak kreativitas dan keragaman dalam konten yang dikurasi dengan tetap menjaga relevansi dan kualitas.
Tugas pembuatan kode membutuhkan ketelitian dan kepatuhan terhadap konvensi. Menetapkan nilai suhu yang rendah antara 0,1 dan 0,5 dapat membantu memastikan pembuatan kode yang akurat dan bebas dari kesalahan. Disarankan untuk menggunakan nilai Top P yang lebih rendah sekitar 0,2 untuk meminimalkan keacakan dan menjaga kesesuaian dengan konvensi yang telah ditetapkan.

Presence penalty

Baik Presence penalty maupun Frequency penalty membantu menghindari pengulangan. Keduanya menghukum penggunaan kata yang sama berulang kali, tetapi dengan cara yang sedikit berbeda. Presence penalty menghukum token berdasarkan apakah token tersebut muncul dalam teks yang dihasilkan sejauh ini, terlepas dari seberapa sering token tersebut muncul.

Hal ini mendorong ChatGPT untuk menggunakan kosakata yang lebih beragam. Semakin tinggi nilai Presence penalty, semakin jelas hukumannya.

Frequency penalty

Frequency penalty menghukum token berdasarkan seberapa sering token tersebut muncul di dalam teks sejauh ini. Jika Anda melihat penggunaan kata-kata yang sama secara berlebihan pada hasil yang dihasilkan, Anda mungkin ingin meningkatkan nilai parameter ini.

Meningkatkan Presence penalty sama dengan memberi tahu ChatGPT untuk tidak menggunakan frasa atau ide yang berulang-ulang, sementara meningkatkan Frequency penalty sama dengan memberi tahu untuk tidak menggunakan kata-kata yang sama terlalu sering.

Nilai optimal untuk Presence penalty dan Frequency penalty

Untuk tujuan mengurangi sampel yang berulang secara moderat, koefisien penalti yang sesuai umumnya berkisar antara 0,1 hingga 1. Namun, jika tujuannya adalah untuk menekan pengulangan secara signifikan, koefisien dapat ditingkatkan hingga 2.

Namun demikian, penting untuk dicatat bahwa peningkatan ini dapat mengakibatkan penurunan kualitas sampel yang nyata. Sebagai alternatif, nilai negatif dapat digunakan untuk secara sengaja meningkatkan kemungkinan pengulangan.