キーワード解説
MMLUおよびGSM8KベンチマークをローカルLLMで実行するための評価環境構築
MMLUやGSM8Kといった標準的な学術ベンチマークをローカルLLMで実行し、モデルの汎用的な知識や推論能力を評価するための環境構築方法を解説します。
0 関連記事
MMLUおよびGSM8KベンチマークをローカルLLMで実行するための評価環境構築とは
親クラスター「ベンチマーク計測」の解説よりMMLUやGSM8Kといった標準的な学術ベンチマークをローカルLLMで実行し、モデルの汎用的な知識や推論能力を評価するための環境構築方法を解説します。
このキーワードが属するテーマ
このキーワードに紐付く記事はまだありません