キーワード解説

「Needle In A Haystack」テストによる長文コンテキスト処理能力の自動評価

LLMが非常に長い入力テキストの中から特定の情報を正確に抽出できるか、「Needle In A Haystack」テストを用いてその長文コンテキスト処理能力を自動的に評価する手法を説明します。

0 関連記事

「Needle In A Haystack」テストによる長文コンテキスト処理能力の自動評価とは

親クラスター「LLM評価指標」の解説より

LLMが非常に長い入力テキストの中から特定の情報を正確に抽出できるか、「Needle In A Haystack」テストを用いてその長文コンテキスト処理能力を自動的に評価する手法を説明します。

このキーワードが属するテーマ

このキーワードに紐付く記事はまだありません