キーワード解説

LLM-as-a-Judge手法による日本語ベンチマークの自動評価パイプライン構築

大規模言語モデル(LLM)を評価者として用いる「LLM-as-a-Judge」手法を導入し、日本語AIモデルの評価を自動化するパイプライン構築の具体例を示します。

0 関連記事