14 3月 2026, 土

ChatGPTの「85%の検索情報は使われない」という事実が示す、日本企業のAI活用とデータ整備の課題

最新の調査によると、ChatGPTは回答を生成する際、検索して取得したウェブページのわずか15%しか最終的な出典として引用していません。本記事ではこのデータをもとに、日本企業が社内AIを構築する際の注意点や、AI時代の情報発信・SEOのあり方について解説します。

AI検索の裏側で起きている「情報の厳格な取捨選択」

生成AIがどのように情報を検索し、回答を生成しているのかについて、非常に興味深い調査結果が報告されました。AirOps社の分析によると、ChatGPTがウェブ検索を通じて取得したページのうち、最終的な回答に引用(出典として明記)されるのはわずか15%にとどまり、残りの85%は使用されていないことが分かりました。

この事実は、大規模言語モデル(LLM)が単に検索結果の上位サイトを要約しているわけではないことを示しています。AIはユーザーの質問(プロンプト)の文脈を深く解釈し、取得した大量の情報の中から「回答に直接結びつく、最も関連性の高い情報」だけを厳選して出力しているのです。このAI特有の情報の取捨選択メカニズムは、日本企業が業務のなかでAIを活用していくうえで、重要な実務的示唆を与えてくれます。

社内AI(RAG)構築における「データ品質」の壁

このメカニズムを、日本企業で導入が急増している「RAG(検索拡張生成:社内ドキュメントなどの外部データをAIに読み込ませて回答させる仕組み)」に当てはめて考えてみましょう。RAGの精度を高めるためには、検索システムが適切な社内資料を見つけ出すだけでなく、AIがその中から「どの情報を採用し、どの情報を捨てるか」を正しく判断できなければなりません。

しかし、日本の企業文化において、業務マニュアルや社内規程は「図解が多用された複雑なPDF」や「暗黙知を前提とした独特の社内用語」で構成されていることが少なくありません。こうしたデータは、検索にはヒットしたとしても、AIにとっては文脈や結論を読み取りづらいため、「取得はされたが最終回答には使われない85%」のノイズとして処理されてしまうリスクが高まります。自社専用のAIで業務効率化を目指す場合、高度なAIモデルを導入する以前に、社内のドキュメントを「AIが理解しやすい論理的な構造(テキスト)」へと整理し直す地道なプロセスが不可欠です。

デジタルマーケティングと「AI時代のSEO」への影響

一方、自社のサービスやプロダクトを顧客に届けるマーケティングの観点でも、この事実は大きな意味を持ちます。ユーザーが検索エンジンではなく生成AIを使って情報収集をする機会が増えるなか、自社のウェブサイトが「AIの回答に引用される15%」に入らなければ、顧客との接点を失うことになります。

これまでのSEO(検索エンジン最適化)では、特定のキーワードを網羅し、検索アルゴリズムに評価される長文コンテンツが有効とされてきました。しかし、AIに選ばれるためには、結論が明確で、論理構造が整理された「LLMフレンドリー」なテキスト構成が求められます。企業が外部に発信する情報も、人間にとっての見た目の良さだけでなく、機械(AI)がいかに正確に意図を抽出できるかという視点で再構築する時期に来ています。

日本企業のAI活用への示唆

今回の調査結果から読み解く、日本企業のAI活用に向けた重要なポイントは以下の3点です。

1. 社内データの「構造化」を推進する:AI(RAG)を導入して業務効率化を図る際は、マニュアルや規程をAIが読み取りやすいプレーンなテキストやマークダウン形式に整理することが、回答精度の劇的な向上に直結します。

2. 情報発信を「LLMフレンドリー」に見直す:自社プロダクトの宣伝やカスタマーサポート用のFAQサイトなどは、結論先行で論理的な構成を心がけることで、AIの検索機能によって顧客に適切な情報が引用・提示されやすくなります。

3. AIの「ブラックボックス性」に対するガバナンス:AIは自律的に情報の85%を切り捨てますが、その過程で「本当に重要な情報」を除外してしまうリスク(ハルシネーションの一因)もあります。AIの判断を鵜呑みにせず、最終的な出力結果を人間が検証するプロセス(ヒューマン・イン・ザ・ループ)を業務フローに組み込むことが、コンプライアンスの観点からも重要です。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です