経費データをChatGPTで分析し、不正や入力ミスの可能性がある項目を異常検知する方法

経費データをChatGPTで分析し、不正や入力ミスの可能性がある項目を異常検知する方法
ITリテラシー

1.概要

このマニュアルは、ChatGPTの高度なデータ分析機能を活用し、経費精算データから不正利用や入力ミスの可能性がある項目を自動で検出する手順を、誰でも実践できるように解説するものです。経理や監査の専門知識がない方でも、対話形式で高精度なデータ監査を実現できます。

2.導入メリット

本手法を導入することで、以下の効果が期待できます。

  • 監査工数の大幅削減: 従来、数日かかっていた全件チェック作業が数十分に短縮され、監査工数を最大80%削減できます。
  • 検知精度の向上: 人間の目では見逃しがちなパターン(例:複数名での同日同店舗での申請)をAIが発見し、不正・入力ミス検知率の向上が期待できます(目標:25%向上)。
  • 不正の抑止効果: 定期的なAI監査の実施により、不正な経費申請を未然に防ぐ抑止力が働き、経費の透明性が向上します。
  • コスト削減: 不適切な経費支出を早期に発見・是正することで、月間の経費支出の1〜3%程度のコスト削減に繋がる可能性があります。

3.注意点

  • 個人情報の匿名化: 経費データに含まれる従業員名や取引先名などの個人・機密情報は、ChatGPTにアップロードする前に必ず匿名化(例:「山田太郎」→「Employee_A」など)してください。
  • AIの判断はあくまで「候補」: AIが検出するのは、あくまで「異常の可能性があるデータ」です。最終的な不正・ミスの判断は、必ず人間が事実確認を行った上で実施してください。
  • データの正確性: 分析結果の品質は、元となるデータの正確性に大きく依存します。日付や金額の入力形式が統一されているか、事前に確認してください。

4.必要な環境(ソフトウェア)

  • ChatGPT Plus(有料版):
    ファイルのアップロードと高度なデータ分析機能(Advanced Data Analysis)を利用するために必須です。
  • 経費精算データ(CSVまたはExcel形式):
    最低でも「申請日」「申請者」「勘定科目」「金額」「摘要(内容)」の列を含むデータが必要です。

5.具体的な作業手順

Step 1. データ準備

分析に使用する経費精算データ(CSVファイル)を準備します。データの品質が分析精度を左右するため、特に「金額」は数値形式、「申請日」は日付形式に統一しておきましょう。

【サンプルデータ:expense_data.csv】

日本のITサービス企業を想定した、異常の可能性を含むデータ例です。

申請ID申請日申請者ID勘定科目金額摘要
10012025/08/05E001交通費2800A社訪問のため(往復)
10022025/08/06E002交際費85000B社との懇親会(4名)
10032025/08/08E003事務用品費5500モニターケーブル購入
10042025/08/10E001タクシー代18500深夜帰宅のため
10052025/08/12E004会議費4500プロジェクト定例(社内)
10062025/08/15E002交際費150000C社役員との会食
10072025/08/15E005交際費12000C社担当者とのランチ
10082025/08/18E001書籍代3200技術書購入
10092025/08/20E003交通費560自宅最寄駅から移動

太字の箇所が、後工程でAIに異常として検出させることを想定したデータです。

Step 2. アップロードと初期分析

  1. ChatGPTの入力欄にあるクリップアイコン(📎)をクリックし、準備したCSVファイルをアップロードします。
  2. ファイルがアップロードされたことを確認し、以下のプロンプトを実行して、データが正しく読み込まれているか確認します。

【プロンプト例】

添付ファイルは、当社の経費精算データです。
あなたは経験豊富な経理・監査担当者として、このデータを分析する準備をしてください。

まず、以下の3点を出力してください。
1. データの項目(列名)とそれぞれのデータ型
2. 全体の件数と、金額の基本的な統計量(合計、平均、最大、最小)
3. 勘定科目ごとの合計金額と件数を集計した表

【期待される出力例】

Step 3. 異常検知ルールの定義と実行

次に、どのような経費を「異常の可能性がある」と判断するかのルールを定義し、分析を実行させます。ルールは自社の経費規程に合わせてカスタマイズしてください。

【プロンプト例】

素晴らしい分析です。ありがとうございます。
次に、以下の異常検知ルールに基づいて、不正や入力ミスの可能性がある経費申請をすべて抽出してください。

【異常検知ルール】
1.  **高額な交際費:** 1回の交際費が100,000円を超えている。
2.  **深夜・休日の利用:** 平日の23時以降、または土日祝日に利用されたタクシー代や交通費。
3.  **重複申請の可能性:** 同じ申請者が、同じ日に、同じ勘定科目で複数回申請している。
4.  **不自然な交通費:** 交通費が1,000円未満で、摘要に具体的な移動区間や目的の記載がない。
5.  **金額の外れ値:** 勘定科目ごとに金額を分析し、統計的に外れ値(他の申請と比較して極端に高い金額)となっているものを検出する。

抽出したデータは、表形式で「申請ID」「申請日」「申請者ID」「勘定科目」「金額」「摘要」「検知理由」をまとめてください。

Step 4. 結果の確認とレポート化

プロンプトを実行すると、ChatGPTがルールに基づいて異常の可能性があるデータを抽出し、表形式でまとめてくれます。

【期待される出力例】

6.よくある問題の解決方法

問題原因解決策
ファイルがアップロードできない、または正しく読み込まれないファイル形式が非対応、またはデータ内に特殊文字や空の行が多く含まれている。ファイルをCSV形式(UTF-8エンコード)で保存し直してください。不要な空の行や列は事前に削除しておきましょう。
期待通りの分析結果にならない(検知漏れや誤検知が多い)プロンプトで指示した「異常検知ルール」が曖昧、またはデータの実態と合っていない。ルールの条件をより具体的にしてください(例:「高額」→「10万円以上」)。また、「前回の結果を踏まえて、ルールをこのように修正して再分析してください」と対話形式で精度を高めていくのが有効です。
AIが正常な申請を「異常」と判定してしまうAIが統計的な外れ値などを過剰に検出してしまった可能性がある。「申請ID XXXXは、〇〇という理由で正常な申請です。このパターンを学習し、今後の分析から除外してください」とフィードバックを与えることで、AIの判断精度が向上します。
グラフや表の日本語が文字化けするChatGPT内部のフォント設定の問題。「グラフが文字化けしています。日本語が表示されるように修正してください」と追加で指示を出してください。

7.端的なまとめ

  • 準備が重要: 経費データを整え、明確な「異常検知ルール」を定義することが、分析の精度を大きく左右します。
  • AIは監査アシスタント: AIを単なるツールとして使うのではなく、「経験豊富な監査担当者」として役割を与え、対話を通じて分析を深めることで、より価値のある洞察を得られます。
  • 最終判断は人間が: AIによる自動検出は、あくまで監査の一次スクリーニングです。検出された項目については、必ず人間が内容を精査し、最終的な判断を下すプロセスが不可欠です。
🖋 記事執筆担当

ビジネス文書実務検定1級、情報処理検定3級の資格を所持。ChatGPTサービス開始当初に触り始め、そこからAIに惹かれる。Bard(現Gemini)、Claudeにも一早く取り組み、その他多くのAIを日々活用している。
AIの知識をもとに、noteにてバイブコーディングを用いたアプリ開発やLLMの活用方法などの、AI情報コンテンツも発信している。

menter_logo

[法人向け]
文系DX人材育成なら『MENTER』

「うちの会社はITリテラシーが低い...」
「DXを行うには人材育成から始めなくては...」
「自動化やAI理解できる社員が増えたらな...」

デジタルに強い人材育成を行うオンライン学習サービス『MENTER』が、そんなお悩みを解決します!

・マンガで楽しくインターネットについて学習
・ショートカットキーからAIの設計まで
・大手企業の導入事例/成功事例あり
・DX人材育成について相談/事例集請求/無料トライアル/ITリテラシー無料診断可能

MENTER紹介ページを‍見る
お問い合わせは ‍こちら

ITスキルアップ相談室

コメント

タイトルとURLをコピーしました