キーワード解説
AIモデルの「思考プロセス」出力を制御して不要なトークン生成を防ぐテクニック
LLMが中間的な思考プロセス(Chain-of-Thoughtなど)を出力する際に、その冗長性を制御したり、最終的な回答のみを生成させたりすることで、出力トークン量を最適化しコストを削減する手法です。
0 関連記事
AIモデルの「思考プロセス」出力を制御して不要なトークン生成を防ぐテクニックとは
親クラスター「トークンあたりの単価削減」の解説よりLLMが中間的な思考プロセス(Chain-of-Thoughtなど)を出力する際に、その冗長性を制御したり、最終的な回答のみを生成させたりすることで、出力トークン量を最適化しコストを削減する手法です。
このキーワードが属するテーマ
このキーワードに紐付く記事はまだありません