キーワード解説

LLM-as-a-Judgeを用いた回答の「忠実性(Faithfulness)」測定パイプラインの構築

大規模言語モデル(LLM)自体を評価者として活用し、人間のような感覚でRAGの回答品質を自動スコアリングするパイプライン構築手法を詳述します。

0 関連記事