ChatGPTのような汎用LLMで法律を学ぶ場面が増えている。手早く要点を整理してくれる便利さがある一方、本試験の答案に直接転記してよい水準とは別物だ、と理解しておく必要がある。本稿では、汎用AIで法律学習を進めるときに見落とされやすい3つの限界と、用途別の使い分けの考え方を整理する。
扱うのは、①条文の正確性をめぐる限界、②判例の射程をめぐる限界(ハルシネーション含む)、③論証の型をめぐる限界、④汎用AIと法律特化型ツールの使い分け、の順である。
限界①——条文の正確性
汎用AIは学習データのカットオフ時点までの情報を中心に応答するため、最近の改正の反映が遅れることがある。民法の債権法改正のように要件・効果が変わった条文では、改正前の規律をそのまま説明してしまう例が見られる。条文の番号についても、110条と112条、刑法199条と204条のような近接条文の取り違えが起こりうる。
本試験の答案で条文番号を1つ取り違えると、それだけで条文の正確性に対する評価が下がる。条文の最終確認はe-Gov法令検索のような一次ソースで行い、AIの回答を一次ソースの代替として扱わない、というルールを最初から決めておくと安全である。
限界②——判例の射程とハルシネーション
判例の引用は、汎用AIの限界が最も顕在化する場面である。実在しない『最判平成○年○月○日』という体裁の引用が生成されることがあり、本試験の答案に転記すると致命的になる。形式が整っているために誤りに気づきにくいのも難点である。
判例引用で起こりやすいパターン
実在しない判例の生成
判例名と日付の形式は整っているが、実在しない判例が生成されることがある。本試験の答案で引用すると致命的であり、判例の存否は最高裁判例集や判例タイムズなどの一次ソースで必ず確認する。
古い判例を改正後に当てはめる
改正前の枠組みで形成された判例を、改正後の事案に機械的に当てはめる回答が見られる。改正前後で要件が変わっている条文では、判例の射程をそのまま引き継いでよいかを別途確認する必要がある。
似た論点の取り違え
通謀虚偽表示の94条2項本文と94条2項類推適用、110条の表見代理と112条の代理権消滅後の表見代理のように、似た論点の判旨を取り違えた回答が起こりやすい。論点を切り分けたうえで、判例集や特化型ツールで照合するのが安全である。
限界③——論証の型
答案の論証は『問題の所在→規範定立→当てはめ→結論』という型に沿って書くことが求められる。汎用AIの回答は会話形式や要約形式で出力されることが多く、そのまま転記すると論証の型が崩れる。本試験の採点はまず型の維持を見るため、ここを崩した答案は内容点に到達しにくい。
対策としては、論証の骨格は予備校の論証集や論証の組み立て方のような型で固定したうえで、汎用AIは個別論点の理解補助や類似事例の説明用途に限定する、という分業が安定する。
汎用AIと法律特化型ツールの使い分け
用途別の使い分け
汎用AIが向く場面
概念の初学者向け説明、他分野からの類推説明、学習計画の壁打ちなど、本試験答案に直接転記しない用途。噛み砕いた説明を引き出すのは得意で、最初の入り口として活用しやすい。
法律特化型ツールが向く場面
条文の正確性確認、判例の射程整理、論証の型の組み立てなど、本試験答案に反映する情報を扱う場面。一次ソースに基づく回答が前提のツールでなければ、答案転記の前提として使うべきではない。
併用する場面
新しい論点に出会ったときには、汎用AIで概念をざっくりつかんだうえで、特化型ツールで条文・判例・論証の型を確定する、という二段階のフローが安定する。導入と仕上げを別ツールに分けるイメージである。
よくある質問
Q. 最新版のChatGPTでも判例の生成ミスは起きるか
A.起こりうる。法律分野は学習データに対して論点が膨大で、最新版でも実在しない判例日付を生成する事例が確認されている。判例の引用は、最高裁判例集
Q. ChatGPTで論証パターンを生成させて覚えるのは有効か
A.理解の補助には有効だが、本試験答案にそのまま転記する用途には適さない。
論証の型は予備校の論証集など、答案を念頭に整備された素材で固めるのが安全である。汎用AIは、その型の中身を理解するための説明役として位置づけるとよい。
Q. 汎用AIと特化型ツールは両方使う必要があるか
A.用途次第である。
本試験答案の精度を上げる用途では、特化型ツールを主軸に据えるのが基本であり、汎用AIは導入や壁打ちに絞ると役割が整理できる。両方を契約することが必須というわけではないが、目的に応じて使い分けを設計すると効率がよい。
関連記事としてAIで法律を学ぶこともあわせて参照してほしい。