キーワード解説

ONNX Runtimeを活用したTransformerモデルのブラウザ上での動作最適化

ONNX Runtimeを利用してTransformerモデルを最適化し、ブラウザ(WebAssembly)環境で高速かつ軽量に推論を実行するための技術と実装例を紹介します。

0 関連記事