変更履歴のない2つの文書、AIに『どこが変わったか』を書き出させる
目視による比較が「もっとも確実」ではない理由
「変更履歴をオンにするのを忘れていた……」
そんな経験、一度や二度ではないはずだ。WordやPDFの資料を、修正前と修正後の2つのファイルで突き合わせる作業。一字一句、あるいは句読点ひとつまで、目を皿のようにして追いかける時間は、精神を削る。
かつて私も、経理の小林さんから「前回のドラフトと数字が微妙に違いますよ」と突き返されたことがある。徹夜に近い状態で、目視だけで2時間かけて比較した結果、結局見落としていたのは、たった一つの「、」と「。」の打ち間違いだった。あの時の、心臓が冷たくなるような感覚は今でも忘れられない。
「目視が一番確実だ」という言い分は正しい。しかし、人間は疲れるし、集中力には限界がある。この記事では、そんな「変更履歴のない2つの文書」を、AIを使って効率的に比較し、差分だけをリストアップさせる手順をまとめる。これを使えば、明日からの「突き合わせ作業」に、少なくとも半分以上の時間を割かずに済む可能性がある。
AIに渡す前に:社内データを守る「置換」のルール
まず、大前提として、社内の機密情報をそのままChatGPTなどのAIに放り込むのは避けてほしい。情シスの及川さんから「セキュリティはどうしてるんだ?」と詰められるのは、私のような管理職にとって一番避けたい事態だ。
AIに文書を読み込ませる前に、固有名詞や重要な数値を「記号」や「仮の名前」に置き換える作業を挟む。この「伏せ方」をルール化しておくと、作業がスムーズになる。
| 元のデータ項目 | AIに渡す際の置換例 | 備考 |
|---|---|---|
| 顧客名・取引先名 | A社、B社、クライアントX | 会社が特定できないようにする |
| 個人名(担当者名) | 担当者A、氏名Y | 役職名だけで十分な場合が多い |
| 金額(予算・単価) | 金額1、金額2、X円 | 桁数や単位だけ残すと比較しやすい |
| プロジェクト名 | プロジェクトα、案件Z | 固有の名称は避ける |
| 日付(締切・予定) | 日付1、日付2 | 月日だけで十分な場合が多い |
この置換作業自体は、Wordの「置換」機能を使えばそれほど時間はかからない。面倒に見えるが、ここで手を抜いて情報漏洩を起こすリスクを考えれば、決して無駄な工程ではない。
文書の規模で使い分ける2つのアプローチ
比較したい文書の量によって、AIへの渡し方は2通りある。どちらが良いか迷うかもしれないが、基本的には「情報の正確性」と「手間」のバランスで決める。
方法A:テキストを直接コピー&ペーストする比較したい箇所が数ページ程度、あるいは特定の段落だけである場合に適している。
- メリット: AIが文脈を読み取りやすく、情報の欠落が少ない。
- デメリット: 文書が長いと、コピペ作業自体が苦行になる。
数十ページに及ぶPDFや、長いWord文書を丸ごと比較する場合に適している。
- メリット: コピペの手間がなく、一気に処理できる。
- デメリット: AIが「要約」してしまう癖があるため、細かい差分を見落とすリスクがある。
結論として、「数ページの短い文書なら方法A」「長大な文書なら方法B」と使い分けるのが、今のところもっとも現実的な判断だ。
実践:AIに差分を書き出させるプロンプト
それでは、具体的な手順に移る。ここでは、もっとも精度が出やすい「方法A(コピペ)」を想定したプロンプトを提示する。
以下のコードブロックをコピーして、ChatGPTなどのAIに貼り付けて使ってほしい。[ ] の部分は、あらかじめ伏せ字にしたテキストに書き換えること。
あなたは、極めて正確な文書比較を行う専門のアシスタントです。提供する「文書A」と「文書B」を比較し、変更箇所を抽出してください。
# 抽出ルール
1. 「追加された内容」「削除された内容」「内容が変更された内容」の3つのカテゴリに分けて整理すること。
2. 「内容が変更された内容」については、必ず【変更前】と【変更後】を併記すること。
3. 文言の微細な変更(助詞の変更、句読点の追加など)も、無視せずにすべて書き出すこと。
4. 変更がない箇所については、一切言及しないこと。
# 出力形式
以下の表形式で出力してください。
| カテゴリ | 箇所 | 変更前 | 変更後 |
| :--- | :--- | :--- | :--- |
| 追加 | ○○の項目 | (なし) | 追加された文言 |
| 削除 | △△の項目 | 削除された文言 | (なし) |
| 変更 | □□の項目 | 変更前の文言 | 変更後の文言 |
---
文書A:
[ここに文書Aのテキストを貼り付け]
---
文書B:
[ここに文書Bのテキストを貼り付け]
このプロンプトのポイントは、AIに「要約」を禁じ、「変更がない箇所には触れるな」と釘を刺している点だ。これにより、AI特有の「だいたいこんな感じです」という雑なまとめを防ぐことができる。
AIが「嘘」をつくとき:陥りやすい失敗パターン
AIは万能ではない。特に文書比較においては、以下の2つの失敗パターンに注意が必要だ。
1. 「要約」による情報の欠落特にファイルアップロード(方法B)を使った際によく起こる。AIは「変更箇所をリストアップして」と頼んでも、気を利かせすぎて「全体的に敬語表現が丁寧になりました」といった、大まかな要約を返してくることがある。これでは、具体的な数字の変更や、条件の追加を見逃してしまう。
対策として、プロンプトに「要約は不要です。事実としての差分のみを抽出してください」と一言添えるのが有効だ。
文書には存在しない変更点を、あたかもあったかのように捏造することが稀にある。特に、似たような文言が並んでいる場合、AIが混乱して「Aにはあったが、Bにはない記述」を、逆に「Bで追加された」と誤認することがある。
これを防ぐ唯一の方法は、AIが出した結果を、重要な箇所(金額、日付、固有名詞など)に絞って、必ず人間が原文と照合することだ。AIに「すべて」を任せるのではなく、AIに「候補」を出させ、人間が「検算」する。この役割分担が、もっともミスが少ない。
さて、ここまで手順を説明した。明日、もし「変更履歴のない資料」を突き合わせる作業が舞い込んできたら、まずはテキストをコピーして、上のプロンプトを試してみてほしい。
ただ、正直なところ、AIが完璧に差分を見つけてくれるまでには、まだ少しコツがいる。私も、プロンプトの微調整にはまだ時間がかかっている。次は、もっと長いPDFを、精度を落とさずに比較させるための「分割読み込み術」について、自分なりに試行錯誤してメモに残しておこうと思う。