キーワード解説

DeepSpeed-Inferenceを用いた超大規模AIモデルの分散推論エンジニアリング

数十億パラメータを超える超大規模AIモデルを複数のGPUやノードに分散させ、効率的かつ高速に推論を実行するためのDeepSpeed-Inferenceの活用法を解説します。

0 関連記事