キーワード解説

ONNXモデルのグラフ剪定(Pruning)によるAI推論の効率化手法

ONNXモデルの計算グラフから不要な接続やニューロンを削除する剪定(Pruning)技術により、モデルを軽量化し推論効率を高める手法を解説します。

0 関連記事