キーワード解説

Vision Transformer(ViT)における空間的アテンションの視覚化技術

画像認識モデルViTが画像内のどの部分に注目しているかを可視化し、モデルの判断根拠を理解するための技術を紹介します。

0 関連記事