生成AIは単にコンテンツを作り出すだけでなく、その質や「創造性」そのものを評価するフェーズへと進化しています。デンバー大学のプロジェクト「OCSAI」を起点に、人間の主観に依存していた創造性評価をAIで代替・支援する技術の現在地と、それを日本企業がR&Dや組織開発にどう取り入れるべきかを解説します。
「拡散的思考」をAIがスコアリングする仕組み
デンバー大学などが開発を進める「OCSAI(Open Creativity Scoring with Artificial Intelligence)」は、AI技術を用いて人間の創造性を測定しようとする興味深い試みです。具体的には、心理学における「拡散的思考(Divergent Thinking)」のテスト結果を評価対象としています。
拡散的思考とは、一つの課題に対してどれだけ多様でユニークな解決策を出せるかという能力を指し、創造性の重要な構成要素とされています。従来、この評価は専門の評価者が手作業で行う必要があり、膨大な時間とコスト、そして評価者間の揺らぎ(主観のブレ)が課題でした。
OCSAIのアプローチは、人間が採点した数千件のデータを教師データとしてLLM(大規模言語モデル)にファインチューニング(追加学習)を施すというものです。これにより、AIは「何が独創的で、何が凡庸か」という人間の判断基準を学習し、高い精度で自動採点を行うことが可能になります。これは、LLMが単なるテキスト生成器から、高度な「判断・評価エンジン」へと進化していることを示唆しています。
日本企業における「評価AI」のユースケース
この技術動向は、日本のビジネス現場においてどのような意味を持つのでしょうか。単に心理テストを自動化するだけではありません。企業における「アイデア創出」や「意思決定」のプロセスに変革をもたらす可能性があります。
第一に、R&Dや新規事業開発におけるアイデアのスクリーニングです。多くの日本企業では、社内ハッカソンやアイデア募集を行っていますが、集まった膨大な案を誰がどう評価するかは常にボトルネックです。AIによるスコアリングを一次フィルターとして活用することで、人間が見落としがちな「一見奇抜だが革新的なアイデア」を拾い上げ、評価プロセスを効率化できます。
第二に、マーケティング・クリエイティブの事前評価です。広告コピーや製品コンセプトがターゲット層にとってどれだけ「新鮮(Novelty)」に映るかを、AIを用いて定量的に予測することが現実味を帯びてきます。これにより、A/Bテストの前段階で候補を絞り込むことが可能です。
文化的バイアスと「日本的創造性」の課題
一方で、この技術を日本企業が導入する際には、特有のリスクと限界を理解しておく必要があります。最大のリスクは「学習データの文化的バイアス」です。
OCSAIのようなモデルの多くは、英語圏のデータセットを中心に学習されています。欧米における「創造性(Creativity)」と、日本の文脈における「趣(Omomuki)」や「改善(Kaizen)」といった価値観は必ずしも一致しません。欧米の基準でファインチューニングされたAIは、日本特有のハイコンテクストな表現や、調和の中にある微細な変化を「独創性なし」と判定する恐れがあります。
また、AIによるスコアリングが普及しすぎると、逆説的ですが「AIが高得点を出しやすいアイデア」へと人間側が最適化してしまい、結果として出力が均質化(コモディティ化)するリスクも孕んでいます。
日本企業のAI活用への示唆
以上の動向を踏まえ、日本の意思決定者やエンジニアは以下の点を意識してAI活用を進めるべきです。
1. 「生成」だけでなく「評価」への投資を
LLMの活用は生成(Generation)に目が向きがちですが、評価(Evaluation)の自動化は業務効率化の鍵です。自社の熟練者が持つ評価基準をLLMに学習させ、継承・自動化するプロジェクトは高いROI(投資対効果)が見込めます。
2. ローカルコンテキストへの適応(ドメスティックな調整)
海外製モデルをそのまま使うのではなく、日本の商習慣や自社の組織文化に合わせた評価基準でプロンプトエンジニアリングやファインチューニングを行うことが不可欠です。「自社にとっての良いアイデアとは何か」を言語化・データ化することがAI活用の第一歩となります。
3. Human-in-the-loop(人間参加型)の維持
創造性の評価をAIに丸投げするのではなく、AIはあくまで「効率的なスクリーニング役」として配置し、最終的な意思決定や、AIが見落とした「文脈的価値」の判断は人間が行うハイブリッドな運用設計が求められます。
