キーワード解説
LLMの性能評価指標:MMLUやHumanEvalを用いた客観的ベンチマーク測定
LLMの言語理解能力や推論能力を客観的に評価するための主要なベンチマーク指標(MMLU, HumanEvalなど)と、その測定方法について解説します。
0 関連記事
LLMの性能評価指標:MMLUやHumanEvalを用いた客観的ベンチマーク測定とは
親クラスター「AI用語集の大規模言語モデル」の解説よりLLMの言語理解能力や推論能力を客観的に評価するための主要なベンチマーク指標(MMLU, HumanEvalなど)と、その測定方法について解説します。
このキーワードが属するテーマ
このキーワードに紐付く記事はまだありません