OpenAIがChatGPTにおける一部の性的・官能的表現を許容する方針を検討していることが報じられました。本記事では、この「セーフガードの緩和」がコンテンツビジネスにもたらす可能性と、日本企業が直面するガバナンス上の課題について解説します。
生成AIのセーフガード緩和とOpenAIの新たな方針
最近、OpenAIがChatGPTにおいて、露骨なポルノグラフィではないものの「官能的・好色な表現(スマット)」を含むコンテンツの生成を許容する、いわゆる「アダルトモード」の導入を検討していることが報じられました。同社の社内アドバイザーから懸念の声が上がる中での判断とされており、AIの安全対策(セーフガード)のあり方を巡って議論を呼んでいます。
大規模言語モデル(LLM)はこれまで、暴力や差別、過激な性的表現などの不適切な出力を防ぐために厳格なコンテンツフィルターを設けてきました。しかし、一律に厳しい制限をかけることは、正当な創作活動まで制限してしまう副作用も持っています。今回の動きは、ユーザーの同意や年齢制限を前提に多様なニーズに応えようとする、AIプラットフォーマーの方向転換として注目に値します。
エンタメ・コンテンツビジネスにおけるメリットと可能性
このようなセーフガードの緩和や表現の選択制の導入は、日本の強みであるエンターテインメント業界やコンテンツビジネスにおいて大きなメリットをもたらす可能性があります。
例えば、小説やゲームのシナリオ制作、恋愛シミュレーションゲームのキャラクター対話などにおいて、人間の機微や恋愛感情を描写する際、これまでの厳格なフィルターでは「規約違反」として生成が拒否されるケース(過剰検知:False Positive)が少なくありませんでした。ガイドラインの範囲内で表現の自由度が高まることは、クリエイターの創造性を支援するAIツールの実用性を大きく引き上げ、新規サービスの開発を後押しすることにつながります。
企業が直面するブランドセーフティのリスク
一方で、生成AIを自社プロダクトや社内業務に組み込もうとする多くの一般企業にとっては、新たなリスク管理が求められます。企業が提供するチャットボットやサポートAIが、意図せず職場での閲覧にそぐわないコンテンツ(NSFWコンテンツ)を出力してしまえば、ブランドイメージの深刻な毀損(ブランドセーフティの危機)を招きかねません。
汎用的なモデルの制限が緩和されたとしても、BtoB向けの業務システムや、一般消費者を対象としたカスタマーサポートにおいては、引き続き厳格なフィルタリングが必要です。今後は、基盤モデル側の設定に依存するだけでなく、企業側が独自の出力フィルター(モデレーションAPIなど)をシステムに組み込み、二重・三重の安全網を構築する技術力がより重要になります。
日本の法規制と組織文化に合わせたAIガバナンス
日本国内での活用においては、国内の法規制と独自の組織文化への配慮が不可欠です。刑法175条(わいせつ物頒布等の罪)などの法令に抵触するコンテンツを生成・配信しないためのシステム的な制御はもちろん、社会通念上許容されるラインを慎重に見極める必要があります。
特に日本企業は、レピュテーションリスク(風評被害)に対して非常に敏感な傾向があります。そのため、AIを導入する際は「どのような表現までなら自社のブランドとして許容できるか」という社内ガイドライン(AIガバナンス)を明確に定めることが急務です。法務やコンプライアンス部門と開発部門が連携し、技術的な制御と運用的ルールの両輪でリスクコントロールを行う体制づくりが求められます。
日本企業のAI活用への示唆
AIのセーフガードが緩和され表現の幅が広がることは、自社のビジネス目的に合わせてAIの振る舞いをより細かくチューニングできる時代への移行を意味します。
実務への示唆として第一に、自社が提供するサービスにおける「適切な表現の境界線」を定義し、それをプロンプト制御やモデレーション機能の導入といったシステム要件に落とし込むことが挙げられます。第二に、エンタメなどの領域においては、クリエイティブの幅を広げる好機と捉え、過度な自主規制に陥ることなく新たなプロダクト開発を模索することが有効です。
今後のAI活用においては、プラットフォーマーが提供する安全対策に完全に依存するのではなく、企業自らがリスクとベネフィットのバランスを取り、主体的にガバナンスを効かせる「責任あるAI」の実践が、ビジネス成功の鍵となるでしょう。
