キーワード解説
GPU推論のスループットを最大化する動的バッチング(Dynamic Batching)の最適設定
GPU推論において、複数のリクエストをまとめて処理する動的バッチングの最適な設定を通じてスループットを最大化する手法です。
0 関連記事
GPU推論のスループットを最大化する動的バッチング(Dynamic Batching)の最適設定とは
親クラスター「画像認識の推論速度最適化」の解説よりGPU推論において、複数のリクエストをまとめて処理する動的バッチングの最適な設定を通じてスループットを最大化する手法です。
このキーワードが属するテーマ
このキーワードに紐付く記事はまだありません