キーワード解説
AIモデルの軽量化を実現するONNXのINT8量子化手法と精度評価
ONNXにおけるINT8量子化技術を用いてAIモデルのサイズを削減し、推論速度を向上させつつ、その精度への影響を評価する手法を解説します。
0 関連記事
AIモデルの軽量化を実現するONNXのINT8量子化手法と精度評価とは
親クラスター「ONNX変換と高速化」の解説よりONNXにおけるINT8量子化技術を用いてAIモデルのサイズを削減し、推論速度を向上させつつ、その精度への影響を評価する手法を解説します。
このキーワードが属するテーマ
このキーワードに紐付く記事はまだありません