大規模言語モデル（LLM）パラメータ「temperature, top_k, top_p」について【初級深層学習講座】

Aru

大規模言語モデル（LLM）には、出力をコントロールするためのパラメータがいくつか存在します。本記事では、LMStudio などの GUI 環境でも設定可能な代表的なパラメータについて解説します。

Contents

大規模言語モデルの主要パラメータ

HuggingFace の Transformer モデルには、いくつかの出力制御パラメータがあります。本記事では、その中でも特によく使われるものを取り上げます。

ここで紹介するパラメータは、LMStudio などの GUI アプリケーションでも調整可能です。

確率分布の平坦さ（エントロピー）を調整するパラメータです。サンプリングを行う前の段階、つまりSoftmax関数に通す前の「ロジット（生のスコア）」に対して作用します。

仕組み
各単語のロジットをTemperature値（T）で割ってから、確率に変換します。
- 数式イメージ: $P_i=\frac{exp(logit_i/T)}{\sum_j{exp(logit_j/T)}}$
効果:
- T < 1（低温）
  - 分布が尖る
  - 高確率の単語はさらに高く、低確率の単語はさらに低くなる
  - 「自信のある単語」を選びやすくなる
  - 論理的・保守的な文章になりやすい（例：0.1〜0.3）
- T > 1（高温）
  - 分布が平坦になる
  - 確率差が縮まり、意外な単語が選ばれやすくなる
  - 多様で創造的な文章になる
  - ただし破綻リスクが上がる
- T = 1
  - 学習された確率分布をそのまま使用

生のスコアが以下だと仮定します。このとき Temperature を変化させた場合の確率変化を見てみます。

下の図が温度を0.1〜5.0まで段階的に変化させた場合の確率の変化です。

温度が 0.1 の場合、犬の確率はほぼ 1.0（100%）になります。温度を上げるにつれて犬の確率は減少し、温度 5.0 では 0.41（41%）程度になります。また次点の猫は約 0.30（30%）になります。

このように Temperature を上げることで、1位以外の候補が選ばれやすくなります。

次の単語（トークン）の選択アルゴリズムが、確率によりサンプリングされるので、温度をあげれば２番目以降の確率が上昇するため、選択されやすくなります。コードでいえば以下のようになります。

chosen_indices = np.random.choice(
       len(logits), size=n_samples, p=probs)

確率分布を調整した後、候補トークンを順位で足切りする手法です。

なお、上位 K 個の集合自体は Temperature によって順位が変わらない限り変化しません。ただし確率値は変わるため、サンプリング時の選ばれやすさは影響を受けます。

Top_Kの弱点を補うために考案された、より動的な足切り手法です。順位ではなく確率の合計値を使います。