キーワード解説

RAGシステムにおけるベクトル検索とAI生成プロセスの推論レイテンシ削減

RAG (Retrieval-Augmented Generation) システムにおいて、情報検索とLLMによる生成の両フェーズにおける推論レイテンシを削減するための戦略を解説します。

0 関連記事