キーワード解説
ONNX Runtimeを活用したエッジデバイス向け軽量LLM APIサーバーの最適化
ONNX Runtimeを利用し、エッジデバイス上で動作する軽量かつ高性能なLLM APIサーバーを最適化する技術について解説します。
0 関連記事
ONNX Runtimeを活用したエッジデバイス向け軽量LLM APIサーバーの最適化とは
親クラスター「APIサーバー連携」の解説よりONNX Runtimeを利用し、エッジデバイス上で動作する軽量かつ高性能なLLM APIサーバーを最適化する技術について解説します。
このキーワードが属するテーマ
このキーワードに紐付く記事はまだありません