キーワード解説
RAGシステムにおけるベクトル検索とAI生成プロセスの推論レイテンシ削減
RAG (Retrieval-Augmented Generation) システムにおいて、情報検索とLLMによる生成の両フェーズにおける推論レイテンシを削減するための戦略を解説します。
0 関連記事
RAGシステムにおけるベクトル検索とAI生成プロセスの推論レイテンシ削減とは
親クラスター「推論の高速化」の解説よりRAG (Retrieval-Augmented Generation) システムにおいて、情報検索とLLMによる生成の両フェーズにおける推論レイテンシを削減するための戦略を解説します。
このキーワードが属するテーマ
このキーワードに紐付く記事はまだありません