キーワード解説

AIモデルの軽量化を実現するONNXのINT8量子化手法と精度評価

ONNXにおけるINT8量子化技術を用いてAIモデルのサイズを削減し、推論速度を向上させつつ、その精度への影響を評価する手法を解説します。

0 関連記事