キーワード解説

大規模言語モデル（LLM）のファインチューニングによる名誉毀損表現の除去技術

大規模言語モデル（LLM）のファインチューニングによる名誉毀損表現の除去技術とは、特定のデータセットを用いて既存のLLMを追加学習させ、名誉毀損にあたる可能性のある不適切な表現を識別・修正・生成抑制する一連の技術です。これは、AIが生成するテキストに含まれる名誉毀損リスクを低減し、より安全で倫理的なAI活用を促進するために不可欠なアプローチです。親トピックである「AIと名誉毀損」が扱う法的・倫理的課題に対し、技術的な解決策を提供する重要な位置づけとなります。具体的には、名誉毀損の定義や過去の判例、社会的な許容範囲などを学習させることで、モデルの応答を調整します。

0 関連記事

大規模言語モデル（LLM）のファインチューニングによる名誉毀損表現の除去技術とは

このキーワードが属するテーマ

テーマ AI著作権・法規制著作権法、AI規制法（EU AI Act等）の解説クラスター AIと名誉毀損 AI名誉毀損リスクと著作権法規制、法的責任を解説

このキーワードに紐付く記事はまだありません