米国の著名な辞典出版社メリアム・ウェブスターとブリタニカが、自社の記事を無断で学習データに使用されたとしてOpenAIを提訴しました。本記事では、この訴訟の背景にある高品質データの価値と、日本企業がAIを活用・開発する上で押さえるべき著作権リスクやガバナンス対応について解説します。
歴史的辞書・百科事典出版社がOpenAIを提訴
米国の著名な辞典出版社であるメリアム・ウェブスター(Merriam-Webster)とブリタニカ百科事典(Encyclopedia Britannica)が、ChatGPTを開発するOpenAIを著作権侵害で提訴しました。訴状によると、約10万件に及ぶ著作権で保護された記事が、ChatGPTの大規模言語モデル(LLM)の学習データとして無断で使用されたと主張されています。これまでも大手メディア企業や作家による訴訟は起きていましたが、正確性と体系的な知識を売りにする「辞書・百科事典」の出版社が法的措置に踏み切ったことは、AI開発における高品質データの価値と権利保護のあり方に新たな波紋を投げかけています。
高品質データを巡るAI開発競争と権利者の反発
生成AIの性能は、学習に使用されるデータの質と量に大きく依存します。特にハルシネーション(AIがもっともらしい嘘を出力する現象)を抑え、正確で論理的な回答を生成するためには、インターネット上の雑多なテキストよりも、専門家によって編纂された辞書や百科事典のような信頼性の高いデータが極めて重要になります。今回提訴に踏み切った両社は、自社の精緻なコンテンツがAIの性能向上にただ乗り(フリーライド)され、結果として自社のビジネスモデルが脅かされていると強い危機感を抱いています。この動きは、良質な独自データを持つ企業が、AIベンダーに対して正当な対価(ライセンス契約など)を求める流れが加速していることを示しています。
日本におけるAIと著作権の現状と留意点
グローバルで相次ぐ学習データを巡る訴訟は、日本企業にとっても対岸の火事ではありません。日本の著作権法第30条の4では、情報解析(AIの学習など)を目的とする場合、原則として著作物の無断利用が認められていますが、「著作権者の利益を不当に害する場合」は例外とされています。現在、この「不当に害する場合」の解釈を巡って文化庁や有識者会議で議論が続いており、将来的な法解釈の明確化やガイドラインの策定によっては、これまでの学習手法やモデルの利用に一定の制約が生じる可能性があります。また、日本企業が自社の新規事業や社内システムにグローバルなAIモデルを組み込む場合、そのモデル自体が海外で著作権侵害の認定を受ければ、サービス提供の停止やレピュテーション(企業ブランド)低下のリスクを負うことになります。
プロダクト開発とガバナンスにおける実務的対応
このような状況下で、日本企業がAIを活用したサービス開発や業務効率化を進めるには、どのようなアプローチが必要でしょうか。第一に、利用する基盤モデル(ファウンデーションモデル)の選定において、開発元の著作権に対するスタンスや、学習データの透明性、ユーザーへの補償(インデムニティ)条項の有無を契約前にしっかり確認するAIガバナンスの体制構築が不可欠です。第二に、AIモデル自体に自社の専門知識を直接学習(ファインチューニング)させるのではなく、RAG(検索拡張生成:外部データベースの情報を検索し、その結果をもとにAIに回答させる技術)を活用し、権利関係がクリアな自社データや正式にライセンスを受けたデータソースと組み合わせる手法が有効です。これにより、著作権リスクを低減しつつ、正確でコンプライアンスを遵守した出力を得ることが可能になります。
日本企業のAI活用への示唆
本件から得られる実務的な示唆は以下の通りです。
・情報ソースの価値再定義:自社で専門性の高い独自のデータやコンテンツを保有している企業は、それをAI時代における新たな資産として捉え、ライセンス提供などの新たなビジネスチャンスとして戦略的な活用を検討すべきです。
・法務・コンプライアンス部門との連携強化:各国の著作権法やAI規制は過渡期にあります。プロダクト担当者やエンジニアは開発の初期段階から法務部門と連携し、利用するAIモデルの法務リスクを継続的にモニタリングするプロセスを組み込む必要があります。
・RAGなどアーキテクチャの工夫:ハルシネーション対策や権利侵害リスクの回避のため、基盤モデル単体の知識に依存するのではなく、信頼できる外部データと連携させるシステム設計(RAGなど)を基本方針とすることが推奨されます。
AIの進化は目覚ましいですが、それに伴う法制や社会規範の形成も同時進行で進んでいます。企業としては、技術のメリットを最大限に享受しつつ、変化するルールに柔軟に適応できる「リスク耐性の高いAIシステム・組織づくり」が求められています。
