キーワード解説

ローカルアテンションによるエッジAIデバイスでのLLM実行効率化

リソース制約のあるエッジデバイスでLLMを効率的に動作させるため、局所的な情報に限定してアテンションを適用する技術を扱います。

0 関連記事