キーワード解説

ソースコードRAGのためのAIベースの抽象構文木（AST）チャンキング

ソースコードRAGのためのAIベースの抽象構文木（AST）チャンキングとは、大規模言語モデル（LLM）を用いたソースコード検索応答システム（RAG）において、コードの構造と意味を正確に捉えて分割（チャンキング）する技術です。従来の単純なテキストベースのチャンキングでは、コードの構文や文脈が失われ、検索精度が低下する課題がありました。ASTを用いることで、関数、クラス、変数宣言といった意味のあるコードブロック単位で分割が可能となり、さらにAIを活用することでそのプロセスを効率化・高度化します。これは、RAG構築における「チャンク分割手法」の中でも、コード特有の課題に対応する高度なアプローチです。

1 関連記事

ソースコードRAGのためのAIベースの抽象構文木（AST）チャンキングとは

このキーワードが属するテーマ

テーマ RAG（検索拡張生成）構築社内データとLLMを連携させる最重要技術クラスターチャンク分割手法 RAG構築の重要ステップ。最適なチャンク分割手法を解説。

ソースコードRAGの精度が劇的向上？「意味」で切るASTチャンキング導入の現実解

従来のテキスト分割ではソースコードRAGの検索精度が出ない理由と、AST（抽象構文木）を用いたチャンキングの有効性を解説。AIベースの手法で実装コストを抑えつつ、コードの構造を維持した検索システムを構築する実践ガイドです。

2026年1月5日