キーワード解説

MMLUおよびGSM8KベンチマークをローカルLLMで実行するための評価環境構築

MMLUやGSM8Kといった標準的な学術ベンチマークをローカルLLMで実行し、モデルの汎用的な知識や推論能力を評価するための環境構築方法を解説します。

0 関連記事

MMLUおよびGSM8KベンチマークをローカルLLMで実行するための評価環境構築とは

親クラスター「ベンチマーク計測」の解説より

MMLUやGSM8Kといった標準的な学術ベンチマークをローカルLLMで実行し、モデルの汎用的な知識や推論能力を評価するための環境構築方法を解説します。

このキーワードが属するテーマ

このキーワードに紐付く記事はまだありません