アンケートの自由記述をAIで分類する、集計作業をラクにする「分類ルール」の渡し方

アンケートExcel分類テキストマイニングAIプロンプト
アンケートの自由記述をAIで分類する、集計作業をラクにする「分類ルール」の渡し方

「要約」ではなく「ラベル付け」をさせる

アンケートの自由記述欄を前にして、ChatGPTに「これを要約して」と頼んで、がっかりしたことはありませんか?
返ってきたのは、全体像を綺麗にまとめた、どこか当たり障りのない数行の文章。「で、結局、何件が『価格』に不満を言っているの?」という、次の集計作業に繋がる具体的な数字がそこにはありません。

この記事では、AIに「要約」させるのではなく、人間が決めたカテゴリーに従って、1件ずつ「ラベル(分類)」を貼り付けさせる具体的な手順を解説します。うまくいけば、これまで数時間かけて手で振り分けていた作業を、AIの下分類と人の確認という形に変えて、だいぶ短くできます。

結局、要約では集計できない

以前、私は新製品のユーザーアンケート、300件ほどの自由記述をAIに丸投げしたことがありました。指示はシンプルに「内容を要約してください」。

すると、AIは「全体として操作性への評価は高く、一部で価格に関する要望が見られます」といった、非常に「それっぽい」文章を生成してくれました。しかし、それを見た部長の第一声は、「で、価格への要望は何件あったの? グラフにできないじゃないか」でした。

結局、私はその夜、300件のテキストを一つずつ読み、Excelに「価格」「機能」「操作性」「その他」と手入力していく作業に戻りました。AIに丸投げした時間は、完全に無駄だったのです。

私たちがやりたいのは、文章の「意味」を知ることではなく、文章を「分類」して、ピボットテーブルで集計できる形にすることです。AIには「賢い要約者」としてではなく、「ルールを遵守する仕分け人」として動いてもらう必要があります。

データを渡す前にやっておくべき「伏せ字」のルール

まず、作業に入る前に必ずやっておかなければならないのが、データの匿名化です。
情シスの及川さんに「セキュリティは大丈夫か?」と突っ込まれてからでは遅いので、以下のルールでExcelのデータを加工しておいてください。

1. 固有名詞を置き換える: 「株式会社△△の佐藤様」→「顧客A」
2. 具体的な金額をぼかす: 「1,234,567円の契約で……」→「[金額]」
3. 日付を汎用化する: 「2023年10月15日の会議にて」→「[日付]」

これらは、Excelの「置換」機能(Ctrl + H)を使って一括で行えます。AIに渡すのは、「何についての意見か」が分かる情報だけで十分です。

【コピペ用】AIへの指示文(プロンプト)の型

分類作業の肝は、指示文(プロンプト)の中に「分類ルール」を厳密に定義することです。
以下のテンプレートをコピーして、[ ] の部分を自分の状況に合わせて書き換えてください。

# 役割

あなたは、カスタマーサポートのデータを整理する熟練のデータアナリストです。
提供するアンケート回答を、指定されたカテゴリーに分類し、Excelに貼り付けやすい形式で出力してください。

# タスク
以下の【分類ルール】に従って、各【アンケート回答】に対して、最も適切な【カテゴリー】を1つだけ割り当ててください。

# 分類ルール
- 「価格」:料金、コスト、値上げ、予算に関する内容
- 「機能」:新しい機能の要望、既存機能の使い勝手、バグに関する内容
- 「サポート」:問い合わせへの対応、マニュアルの分かりやすさに関する内容
- 「その他」:上記のいずれにも該当しない内容

※必ず、回答内容に最も近いものを1つ選んでください。迷った場合は「その他」としてください。

# 出力形式
以下の形式の表(Markdown形式)で出力してください。余計な解説や挨拶は一切不要です。

| 回答ID | カテゴリー |
| :--- | :--- |

# アンケート回答
1 | [ここに1件目のコメントを入力]
2 | [ここに2件目のコメントを入力]
3 | [ここに3件目のコメントを入力]
...

方法A(1件ずつ)と方法B(まとめて)の使い分け

データの量や、分類の難易度によって、AIへの渡し方は2つの方法を使い分けます。

特徴方法A:1件ずつ(または少人数ずつ)方法B:まとめて(一括)
やり方10〜20件程度の塊で指示を出す50〜100件程度を一度に流し込む
向いているケース分類ルールが複雑で、判断が難しい場合分類ルールが単純で、件数を一気に減らしたい場合
メリット精度が非常に高く、間違いが少ない作業スピードが圧倒的に早い
デメリットコピペの回数が増えるAIが途中でルールを忘れたり、回答を省略したりすることがある
結論としての使い分け方:

まずは「方法B」でまとめて投げてみてください。もし、結果を見て「なんだか分類が雑だな」と感じたら、すぐに「方法A」に切り替えて、小分けにして指示を出す。今のところ、これが手戻りの少ないやり方です。

ここで失敗する。よくある落とし穴

AIに分類させる際、初心者が陥りやすい失敗が2つあります。

1. カテゴリーを増やしすぎる

「価格」「機能」「操作性」「サポート」「UI」「UX」「要望」「不満」「その他」……。
このようにカテゴリーを細かく設定しすぎると、AIの判断がブレます。AIも人間と同じで、選択肢が多いと「どれも正解に見える」状態になり、分類が迷走します。
カテゴリーは、まずは5つ以内に絞るのがコツです。まずは大分類で集計し、必要に応じて後から「その他」の中身を見て細分化する方が、実務上のスピードは上がります。

2. 「その他」の定義を忘れる

「どれにも当てはまらない場合は『その他』にしてください」という一言がないと、AIは無理にでも既存のカテゴリーに当てはめようとします。これを「ハルシネーション(もっともらしい嘘)」の一種と捉えてください。
「無理に分類せず、迷ったら『その他』と言え」と、逃げ道を作ってあげることが、データの正確性を保つための鉄則です。

明日の作業に向けたステップ

もし今、目の前に大量の自由記述があるなら、まずはExcelの1行目から10行目くらいまでをコピーして、上記のプロンプトに貼り付けてみてください。

1. Excelからデータをコピーする(伏せ字にすることを忘れずに)
2. プロンプトの[ ] を埋める
3. AIに投げる
4. 返ってきた表をExcelに貼り付ける

うまくいけば、午前中の作業は「分類そのもの」から「分類結果の確認」に寄っていきます。とはいえ、線引きが微妙な回答の判断は最後まで残りますが。

さて、私はそろそろ、この分類結果をピボットテーブルに放り込んで、部長への報告資料を仕上げるとします。