ChatGPT 設定について: 温度、Top P、Presence penalty、および Frequency penalty

ChatGPT のパラメータによって提供される柔軟性とカスタマイズオプションにより、ChatGPT はさまざまなタスクに対応する多用途ツールになります。温度、Top P、Presence penalty、Frequency penalty などのパラメーターを調整することで、ユーザーは特定のニーズに合わせてモデルの出力を微調整できます。創造的な文章を書く場合でも、正確な答えを生成する場合でも、モデルの言語スタイルを形成する場合でも、これらのパラメータを理解して利用することで、ChatGPT の有用性と有効性を大幅に高めることができます。

ChatGPT設定

温度

温度は、生成される応答のランダム性を制御します。温度の値が高いほどランダム性が増し、応答がより多様で創造的になりますが、値が低いほど応答はより集中的で決定的になります。

創造的な執筆タスクやアイデアのブレーンストーミングでは、さまざまな可能性を探るために、より高い温度値 (例: 0.8 ～ 1.0) が好まれることがよくあります。一方、事実に基づいたクエリの場合、または正確な回答を生成する場合は、より正確で信頼性の高い応答を保証するために、より低い温度値 (たとえば、0.2 ～ 0.5) が推奨されます。

Top P

Top P パラメーターは、単語の確率分布を切り捨てることによって、生成される出力の多様性を制御します。これは、言語モデルが次の単語を予測する際に検査する単語またはフレーズの数を決定するフィルターとして機能します。たとえば、Top P 値が 0.4 に設定されている場合、モデルは最も可能性の高い単語またはフレーズの 40% のみを考慮します。

より高い Top P 値 (例: 0.9 ～ 1.0) を設定すると、より幅広い選択肢が確保され、より多様な応答が得られます。これは、斬新さが求められるクリエイティブなタスクに役立ちます。逆に、Top P 値が低い (たとえば、0.1 ～ 0.5) と、選択肢が最も可能性の高いものに制限され、応答がより集中的で一貫したものになります。

温度とTop Pの違いは何ですか?

Top P は、ChatGPT が使用できるトークン (単語と記号) の範囲を定義します。 Top P = 1 の場合、言語モデルは応答の生成中に任意のトークンを使用できます。 Top P = 0.5 の場合、最も可能性が高い/適切/一般的なオプションの 50% のみを使用できます。

一方、温度は ChatGPT が特定のトークンを選択する可能性を決定します。温度が 1 の場合、ボットは利用可能なすべてのオプション (Top P 境界内) に対して等しい確率を持ちますが、値が低いほど、より頻繁に使用される単語やフレーズに傾きます。

温度とTop Pの最適値

さまざまなタスクに最適な温度と Top P の値は、クライアントまたは出版物の特定の要件と設定によって異なります。

記事作成の場合、より低い温度値（例えば、約0.5-0.7）と中程度から高いTop P値（例えば、約0.8-0.9）は、人工知能モデルからの創造的な入力を可能にしながら、より焦点を絞った首尾一貫した記事を生成するのに役立ちます。
商品説明の場合、やや高めの温度値（例：約0.7～0.8）と中程度のTop P値（例：約0.7～0.8）を設定すると、潜在的な顧客にとって際立つ、ユニークで魅力的な説明を作成するのに役立ちます。
言語翻訳では、低い温度値（例：約0.5～0.7）と中～高いTop P値（例：約0.8～0.9）を設定することで、自然な響きを維持しながら正確な翻訳を行うことができます。
バーチャルアシスタントのタスクの場合、中程度の温度値（例：約0.7～0.8）と中～高程度のTop P値（例：約0.8～0.9）を設定することで、有益で魅力的な、インタラクティブで役に立つ応答を作成することができます。
コンテンツのキュレーションでは、温度値を高く（例：0.8～0.9程度）、Top P値を低く（例：0.2～0.4程度）設定することで、関連性と品質を維持しながら、キュレーションされたコンテンツの創造性と多様性を高めることができます。
コード生成タスクは、正確さと規約の遵守を必要とする。0.1～0.5の間の低い温度値を設定することで、正確でエラーのないコードを確実に生成することができる。ランダム性を最小限に抑え、確立された規約への準拠を維持するために、0.2程度の低いTop P値を使用することが推奨される。

Presence penalty

Presence penaltyもFrequency penaltyも繰り返しを避けるのに役立つ。どちらも同じ単語を何度も使うことにペナルティを与えますが、その方法は少し異なります。Presence penaltyは、出現頻度に関係なく、生成されたテキストに出現したかどうかでトークンにペナルティを与えます。

これはChatGPTがより多様な語彙を採用することを促します。Presence penalty の値が高いほど、ペナルティはより顕著になります。

Frequency penalty

Frequency penalty は、トークンがテキストに現れる頻度に基づいてペナルティを与えます。もし生成された結果に同じ単語が多用されていることに気づいたら、このパラメータの値を増やすとよいでしょう。

Presence penaltyを増やすことはChatGPTに繰り返しのフレーズやアイデアを使わないように指示するようなもので、Frequency penaltyを増やすことは同じ単語を頻繁に使わないように指示するようなものです。

Presence penaltyとFrequency penaltyの最適値

繰り返しサンプルを適度に減らす目的であれば、適切なペナルティ係数は一般的に0.1～1の範囲です。しかし、繰り返しを大幅に抑制することが目的であれば、係数を2まで増やすことができます。

とはいえ、この増加によりサンプルの品質が顕著に低下する可能性があることに注意することが重要です。また、意図的に繰り返しの可能性を高めるために、負の値を採用することもできます。