法律AIが条文を読む仕組みと限界——LLM・RAG・著作権法47条の5を整理する | Elenco

改正後の民法の条文番号をAIに聞いたら、改正前の番号を自信満々に返してきた——そういう経験を持つ法学生は今、確実に増えている。原因はAIへの信頼過多ではなく、仕組みを知らないまま使っていること。仕組みを把握すれば、どの場面でAIを信じて、どの場面で一次情報を引くべきかが自然にわかる。本記事では、法律AIが条文を「読む」3技術（汎用LLM・RAG・ファインチューニング）を構造から整理し、著作権法47条の5が認めた情報解析の適法化と、本番で詰まる4つの限界を解説する。[[ChatGPTと法律学習の限界]](/blog/chatgpt-houritsu-gakushu-genkai)・[[AI判例分析の手順]](/blog/ai-tousankosatsu-vs-jibun)も合わせて読みたい。

汎用LLMが条文を「読む」仕組み——次トークン予測の連鎖

GPT・Claudeなどの汎用LLMは、大量テキストから「次に来る単語（トークン）」の確率分布を学習したモデル。条文を「理解」しているのではなく、条文に関する大量テキストのパターンから**「もっともらしい続き」を生成している**にすぎない。ここが重要なポイント。学習データに含まれる条文が改正前のものであれば、改正後の正しい条文番号・規範を問うても、古いパターンから回答が生成される。「正しそうに見える答え」が実は改正前の規定、というケースが答案で頻発する理由はここにある。

RAG——外部DBを参照してから生成する、精度向上の核心技術

RAG（Retrieval-Augmented Generation）は、回答生成前に外部データベースを検索し、検索結果を「文脈」としてLLMに渡す技術。法律AIではe-Gov法令データ・裁判所判例DBをリアルタイム検索してから回答する。押さえておきたいのは、**RAGの精度は「検索クエリの精度」と「引用範囲の適切さ」で決まる**という点。ユーザーの質問から条文番号・キーワードを正確に抽出できなければ、関連条文を取りこぼす。さらに検索ヒットから「本当に根拠になる部分」だけを切り出せなければ、別事案の判旨を引いてしまう。Elencoは両工程を最適化し、引用原文へのリンクでユーザーが一次情報を確認できる構造を採っている。

著作権法第47条の5（電子計算機による情報処理及びその結果の提供に付随する軽微利用等）

電子計算機を用いた情報処理（情報解析その他の電子計算機による情報処理をいう。）により新たな知見又は情報を創出することを目的として、著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合には、その必要と認められる限度において、いずれの方法によるかを問わず、利用することができる。（平成30年改正・第1項より抜粋。原文はe-Gov法令データベース参照）

2018年（平成30年）著作権法改正で追加された47条の5が、法律AIのRAG構築を法的に後押しした。「情報解析目的」であれば著作物（判例・論文等）の複製・翻案が一定の範囲で適法化され、改正前には法的グレーゾーンだった大規模なDB構築のハードルが下がっている。注意が必要なのは「享受目的」の利用は対象外という点。判例の原文を大量に集めてRAGデータとして用いる場合は、情報解析目的の範囲に収まるよう設計する必要がある。

ファインチューニング——専門性は高まるが「法改正」には弱い

ファインチューニングは、汎用LLMを法律データで追加学習して専門性を高める手法。法律用語の定義・判例の規範パターンへの応答精度が上がる一方、追加学習データのカットオフ以降の情報（法改正・新判例）は反映されない。見落としやすいのは、ファインチューニング済みモデルが**「自信を持って古い情報を出す」**パターン。専門用語を正確に使いながらも、最新改正前の規定を回答するケースは実務・試験対策双方で危険。最新法令への追従にはRAGとの組み合わせが不可欠。

法律AI 3技術の構造比較

① 汎用LLM（RAGなし）

学習時の統計パターンから回答。改正前の条文番号・廃止された規範を出すリスクが最も高い。論点列挙・仮説生成の初期段階には有効だが、最終的な条文確認には使えない。

② RAG（検索拡張生成）

外部DB（e-Gov等）をリアルタイム検索してから回答。最新法令・判例への対応が可能で、回答に原文リンクを付記できる。検索クエリ精度と引用範囲の設計で品質が決まる。

③ ファインチューニング

法律データで追加学習した特化モデル。専門用語への応答精度は高いが学習カットオフ以降の改正に未対応。RAGとの組み合わせで最新性を補う設計が現実的。

法律AIの4つの限界——「正しそう」が最も危ない場面

本番（答案・実務）で詰まる4つのパターン

① カットオフ問題（法改正・新判例の未反映）

学習データの時点以降の改正・新判例は反映されない。民法改正（2020年施行）・会社法改正（2021年施行）など近年の改正後の条文番号を問うと、改正前の番号を出すケースが頻発する。一次情報（e-Gov法令API・裁判所HP）での確認を必ず挟む。

② 解釈の一義化（学説対立の省略）

条文には複数の解釈・学説が存在するが、AIは「一つの正解」として回答しやすい。通説・判例立場・有力少数説の対立をAIが省略するパターンを把握する。答案では学説対立を明示しないと減点されることがある。

③ ハルシネーション（存在しない判例・条文番号）

AIが「もっともらしいが実在しない」判例・条文番号を生成するケース。判旨の引用符「」内が正確でない場合も多い。引用判例は必ず裁判所HP・判例タイムズ等の一次情報で確認。

④ 秘匿特権の不適用（機密情報の入力リスク）

弁護士との会話は法的秘匿特権の保護を受けるが、AIとの会話はその対象外。依頼人情報・案件の機密情報をAIに入力する前に、サービスのデータ保管ポリシーを必ず確認する。

本番で機能する3ステップ——AI下書き→一次情報照合→論証ストック

法律AI活用の3段階プロセス

STEP 1：AI下書き（論点列挙・仮説生成）

汎用LLMまたはRAG搭載AIで条文・論点の網羅的な列挙を行う。この段階では「完全に正確」より「抜け漏れなく洗い出す」ことが目的。複数のAIを並列に使い、共通して出てきた論点を核にする。[ChatGPTと法律専門AI比較](/blog/chatgpt-vs-ai-law-tool)も参考に。

STEP 2：一次情報照合（e-Gov・裁判所HPで確認）

AIが出した条文番号・判例・判旨を必ず一次情報で確認。e-Gov法令データベースで条文原文、裁判所HPで判決文を引く。「条文番号の正確性」「判例の日付・事件番号」「判旨引用の正確性」「改正前後の正誤」の4軸をチェック。

STEP 3：論証ストック登録（AI下書き+照合済みの2版管理）

「AI下書き版」と「一次情報照合済み版」を並列で論証ストックに保管。3ヶ月に1度は最新改正・新判例と照合してストックを更新。AI由来の古い情報が塩漬けにならない仕組みを作る。[刑法199条（殺人罪）の論証例](/blog/keiho-199-satsujin)でこの型を確認できる。

Elencoの条文検索は、AI解説に原文（e-Gov）リンクを自動付記。カットオフ問題・ハルシネーションを一次情報で即座に照合できる設計。[条文を検索する（無料）](/search)

条文を検索する

法律AIの3技術（汎用LLM・RAG・ファインチューニング）を構造から理解すれば、「どこで信じてどこで一次情報を引くか」が自然にわかる。カットオフ問題・ハルシネーション・解釈の一義化の3つを把握した上で、AI下書き→一次情報照合→論証ストック登録の3段サイクルを回す。今日からElencoの条文検索で、AI解説と原文を並べて見比べる習慣を作ってほしい。

条文を検索する

💡 **次に同じ論点で詰まったら、Googleで「elenco 法律AI 仕組み」と検索する習慣**をつけると、本記事・条文ビュー・関連判例・AI演習が一画面で開けます。Elencoは予備試験・司法試験対策の法学プラットフォームです。 — [Elencoで条文検索する（無料）](/search) ／ [Elencoでこの論点をAI演習](/practice)

条文を検索する

関連論点として[ChatGPT法律学習の3つの限界——本番で取りこぼすハルシネーションの正体](/blog/chatgpt-houritsu-gakushu-genkai)、[AIで倒産判例を2倍速で分析する](/blog/ai-tousankosatsu-vs-jibun)、[ChatGPTとAI法律ツール比較](/blog/chatgpt-vs-ai-law-tool)もあわせて整理しておきたい。