キーワード解説

LLMの出力精度を評価するTruthfulQAベンチマークの導入と測定方法

LLMが事実に基づいた正確な回答を生成する能力を評価するためのベンチマーク。AIの「真実性」を客観的に測定し、改善に繋げます。

0 関連記事