キーワード解説
推論時の動的バッチング(Dynamic Batching)によるAIリソース利用効率の最大化
AI推論において、リクエストの到着状況に合わせてバッチサイズを動的に調整する「動的バッチング」により、GPUなどのリソース利用効率を最大化する手法を解説します。
0 関連記事
推論時の動的バッチング(Dynamic Batching)によるAIリソース利用効率の最大化とは
親クラスター「推論サービング」の解説よりAI推論において、リクエストの到着状況に合わせてバッチサイズを動的に調整する「動的バッチング」により、GPUなどのリソース利用効率を最大化する手法を解説します。
このキーワードが属するテーマ
このキーワードに紐付く記事はまだありません