キーワード解説
LLM-as-a-Judge手法による日本語ベンチマークの自動評価パイプライン構築
大規模言語モデル(LLM)を評価者として用いる「LLM-as-a-Judge」手法を導入し、日本語AIモデルの評価を自動化するパイプライン構築の具体例を示します。
0 関連記事
LLM-as-a-Judge手法による日本語ベンチマークの自動評価パイプライン構築とは
親クラスター「日本語ベンチマーク」の解説より大規模言語モデル(LLM)を評価者として用いる「LLM-as-a-Judge」手法を導入し、日本語AIモデルの評価を自動化するパイプライン構築の具体例を示します。
このキーワードが属するテーマ
このキーワードに紐付く記事はまだありません