会議は予定より30分押し、承認ルートは滞り、チャットツールには「至急」の通知が積み上がる。ようやくデスクに戻り、一息つこうとした瞬間に目に入る、大量のPDFファイル。
「これ、全部Excelにまとめておいて」
上司から渡された(あるいはメールで送られてきた)その指示。あなたは、画面の左側にPDF、右側にExcelを並べ、目を細めながら、一行ずつ数字を打ち込み始める。コピー&ペーストを試みるが、改行が崩れる、表の枠組みがバラバラ、あるいはそもそもテキスト選択すらできない画像化されたPDF。
「……またこれか」
キーボードを叩く指先に、わずかな虚無感が走る。この作業に、あなたの高度な専門性や判断力は必要ない。必要なのは、視力と、指の正確さと、間違えたときに「すみません」と言い訳する根性と、それだけだ。
もしあなたが、この「PDFをExcelに打ち込む作業」を、一種の修行や、避けられない運命だと思っているなら、今すぐその思考を捨ててほしい。それは「仕事」ではなく、単なる「データの転送」であり、AIが最も得意とする、人間がやるべきではない領域だからだ。
現場を見渡せば、この「デジタル化されているはずなのに、アナログな作業が残っている」状況は、あちこちに潜んでいる。
なぜ、これほどまでに「打ち込み」が蔓延しているのか。理由はシンプルだ。多くの現場において、データが「構造化」されていないからである。
私たちがExcelで扱いたいのは、「項目名(キー)」と「値(バリュー)」がセットになった、整然とした情報だ。しかし、世の中に出回るPDFの多くは、人間が「読むこと」を前提に作られた「非構造化データ」である。
「名前:山田太郎」「住所:東京都……」といった情報が、ある資料では表の中にあり、ある資料では文章の中に埋もれている。これらをExcelという「箱」に整理して入れるには、人間がその「意味」を読み取り、適切な場所に振り分ける必要がある。
これまでの現場では、「人間が読むのが一番早いし、正確だ」という、ある種の高慢な、しかし切実な判断によって、この非効率が正当化されてきた。
ここで一つ、重要な誤解を解いておかなければならない。「OCR(光学文字認識)を使えば解決するのでは?」という問いだ。
確かに、OCR技術は進歩した。スキャンした画像から文字を読み取る技術は、もはや魔法に近い。しかし、「文字を読み取ること」と「データを整理すること」は、全くの別問題である。
従来のOCRや、安価な変換ツールが抱える限界は、以下の3点に集約される。
1. レイアウト依存の罠: 「左上にあるこの数字は金額である」というルールを教え込む必要がある。PDFの形式が少しでも変わると、読み取り位置がズレ、ゴミのようなデータが生成される。
2. 文脈の欠如: OCRは「1,200」という数字は読み取れるが、それが「単価」なのか「消費税」なのか「合計金額」なのかを判断できない。
3. 非構造データの壁: 文章の中に「〇〇株式会社、担当者:佐藤、電話番号:03...」と書かれている場合、OCRはこれらをただの「文字列の羅列」として出力する。これをExcelの「会社名」「担当者」「電話番号」という列に分ける作業は、依然として人間の手作業として残る。
つまり、これまでのIT化は「紙をデジタルデータ(文字)に変えること」には成功したが、「データを、コンピュータが扱える形式(構造)に変えること」には失敗していたのだ。
この「意味の抽出」というプロセスが、現場の人間をExcelの打ち込み作業に縛り付けている真犯人である。
では、どうすればこの呪縛から逃れられるのか。ここで登場するのが、生成AI(大規模言語モデル)を中心とした、新しいアプローチだ。
これまでの「OCR」が、単なる「文字の書き写し」だったのに対し、最新のAI活用は「情報の構造化」を目指す。
AIは、文字を読み取るだけでなく、その「文脈」を理解できる。例えば、バラバラな形式の請求書をAIに渡したとき、AIに対して「このPDFから、会社名、日付、合計金額を抜き出して、JSON形式(コンピューターが理解しやすい形式)で出力して」と命じることができる。
ここで重要なのは、AIに対して「どこにあるか」ではなく「何であるか」を指示できるという点だ。
| 特徴 | 従来のOCR / 変換ツール | AIによる構造化 |
|---|---|---|
| 指示の出し方 | 「座標(位置)」を指定する | 「意味(項目名)」を指定する |
| レイアウト変更 | 対応不可(エラーや誤読が起きる) | 対応可能(文脈から判断できる) |
| データの形 | 文字の羅列(バラバラ) | 表形式・リスト形式(整然) |
| 人間の役割 | ゼロから打ち込む「作業者」 | 抽出結果をチェックする「検品者」 |
AIを活用することで、業務のフェーズは「入力」から「検品」へとシフトする。
もちろん、AIが完璧なわけではない。読み間違いや、指示の解釈ミスは起こり得る。しかし、「ゼロから100まで打ち込む」のと、「AIが作った90点のものを、10分かけて100点に直す」のでは、投入すべきエネルギーが決定的に違う。
「AIに任せきりにする」のではなく、「AIに下書きをさせ、人間は承認に徹する」。この思考法への転換こそが、業務効率化の正体である。
いきなり高価なシステムを導入したり、プログラミングを学んだりする必要はない。そんなことをしている間に、また次のPDFが届いてしまうからだ。
明日から、あるいは今日から、あなたが「打ち込み作業」から脱却するためにできる、現実的な一手を提示する。
まず、自分が抱えている「面倒なPDF」のサンプルを一つ用意する。そして、ChatGPTやClaudeなどの生成AIに、そのファイルを直接アップロードしてみるのだ。
指示(プロンプト)はこうだ。
「このPDFの内容を読み取り、以下の項目を抽出して、Excelに貼り付けられるような表形式で出力してください。項目は【日付、取引先名、金額、備考】です。」
これで、もし期待通りの結果が返ってくるなら、あなたの業務の半分以上は「自動化可能」であるという確信が得られる。この「確信」こそが、改善に向けた最大の武器になる。
「何を打ち込むか」を考える前に、「Excelの列(ヘッダー)をどうしたいか」を先に決めてしまうことだ。
AIに指示を出す際、あるいはツールを選ぶ際、ゴールとなるExcelの形が明確でないと、結局後で人間が手直しすることになる。
「最終的にこのExcelのA列にはこれ、B列にはこれが入っている状態にしたい」という、完成図(構造)を先に定義する習慣をつけてほしい。
もし、あなたがリーダーや管理職なら、部下に対して「これをExcelにまとめておいて」と指示するのをやめよう。
代わりに、「このAIツール(あるいは外部サービス)を使って、PDFからデータを抽出させ、その結果に間違いがないかチェックして報告して」と指示を変えてほしい。
「打ち込み」は単純作業であり、ミスをしても「頑張った」という評価には繋がらない。しかし、「AIを活用して精度高くデータを抽出・検品する」ことは、立派な「業務プロセス設計」という知的作業である。
「PDFをExcelに打ち込む」という作業は、決して避けて通れない聖域ではない。
それは、テクノロジーの進化によって、すでに解体され始めている古い慣習に過ぎない。
目の前の文字を追いかけて視力を削るのをやめ、その情報の「意味」をどう扱うべきか、という視点を持つこと。それが、AI時代に「命を削らない」ための、たった一つの思考法である。