キーワード解説

動的ドロップアウト率の制御による大規模言語モデルの過学習抑制

大規模言語モデル特有の過学習問題に対し、学習の進行度に応じてドロップアウト率を動的に調整する最新技術を詳述します。

0 関連記事