コンテンツカテゴリ
用語
AIによる要約
言語モデルの性能を測定するための指標。低い値が良い性能を示す。
コンテンツ
タグ
モデル性能評価
レベル
ツール
ChatGPT
作成日時
Jan 29, 2024 7:32 AM
最終更新日時
Jan 29, 2024 7:32 AM
Perplexityは、モデルがデータセットの内容をどれだけうまく予測できるかを測る指標です。 モデルがデータセットに割り当てる尤度が高いほど、Perplexityは低くなります。
数学的には、Perplexityはトークンごとの平均負の対数尤度の指数として定義されます:
要約すると、この数式はモデルが特定のテキストコーパスをどれだけ「予想外」または「予想通り」に見つけるかを数値化します。Perplexityが低いほど、モデルはテキストをよりよく予測できていると考えられます。逆に、Perplexityが高い場合、モデルはテキストの予測に苦労していることを意味します。