キーワード解説

複数枚のコンシューマーGPUを活用したモデル並列化とメモリ配分

複数のコンシューマー向けGPUを連携させ、モデルを並列化して実行することで、VRAMの総量を増やし、より大規模なLLMをローカルで動かす方法を解説します。

0 関連記事