NTTの独自LLM「tsuzumi 2」が、図表を含む日本語ビジネス文書の処理能力を強化しました。本記事では、このアップデートを紐解きながら、日本特有の複雑な文書フォーマットをAIでどう処理し、ガバナンスを効かせながら業務活用していくべきかを解説します。
国産LLMの進化が示す、ビジネス文書処理の新展開
NTTが自社開発する大規模言語モデル(LLM)「tsuzumi」の次世代版である「tsuzumi 2」において、図表を含む日本語ビジネス文書の処理能力を強化したことが報じられました。生成AIの世界では、テキストだけでなく画像や図表などを同時に理解する「マルチモーダル化」が進んでいますが、このアップデートは単なる技術的進歩にとどまらず、日本企業の現場におけるAI活用に大きな意味を持ちます。グローバルな汎用AIモデルが急速に進化する一方で、日本の商習慣に根ざしたドキュメントを正確に読み解くことには、依然として独自のハードルが存在するからです。
なぜ「図表を含む日本語文書」の処理が重要なのか
日本企業の業務ドキュメントには、独特の文化や商習慣が反映されています。複雑にセルが結合されたスプレッドシート(いわゆる「Excel方眼紙」)、罫線が多用された帳票、図面とテキストが混在する製造業の仕様書やマニュアルなど、視覚的なレイアウトに依存した文書が多数存在します。従来のOCR(光学式文字認識)技術や、英語圏のデータ群を主軸に学習した海外製LLMでは、こうした「日本特有の複雑な図表・レイアウト」を正確に読み取り、文脈に沿って意味を抽出することが困難でした。tsuzumi 2のような日本語と日本のビジネスフォーマットに特化したモデルが図表処理能力を向上させることは、これまでデータ化や検索の対象から漏れていた「社内に眠る膨大な非構造化データ」を、AIの知識源として活用できる可能性を広げます。
軽量・特化型モデルが日本企業にもたらすメリットと限界
NTTのtsuzumiに代表される国産LLMの多くは、パラメーター数(AIの規模を示す指標)を抑えた「軽量モデル」として設計されています。軽量であることの最大のメリットは、計算資源のコストを抑えつつ、企業内のオンプレミス(自社運用)環境やセキュアな閉域網で稼働させやすい点にあります。金融機関や医療機関、製造業の設計部門など、機密性の高いデータを扱う日本企業にとって、外部のクラウドにデータを送信しないセキュアなAI環境の構築は、AIガバナンスやコンプライアンスの観点から不可欠な要件です。一方で、軽量・特化型モデルには限界もあります。汎用的な推論力や、多言語でのクリエイティブな文章生成といった領域では、膨大なパラメーターを持つ海外の巨大モデル(GPT-4など)に分があります。万能な一つのAIを求めるのではなく、用途やデータの機密性に応じて複数のLLMを使い分けるアーキテクチャ設計が、今後のエンジニアやプロダクト担当者には求められます。
実務への組み込み:想定されるユースケース
図表処理能力とセキュアな環境での稼働を組み合わせることで、日本国内のニーズに直結した様々なユースケースが想定されます。例えば、製造業における「過去の不具合報告書や設計図面の検索システム」です。これらをRAG(検索拡張生成:社内データとLLMを連携させ、事実に基づいた回答を生成する仕組み)に組み込むことで、若手エンジニアが自然言語で質問し、図表入りの古いマニュアルから正確な手順を導き出すといった業務効率化が可能になります。また、自治体やバックオフィス業務においては、フォーマットが定まっていない取引先からの請求書や、複雑なレイアウトの申請書類から必要な数値を自動抽出し、基幹システムに連携させるといった業務プロセスの自動化(ハイパーオートメーション)への貢献も期待されます。
日本企業のAI活用への示唆
第一に、AI導入を検討する意思決定者は「どのモデルを使うか」の前に、「自社のどのようなドキュメント(データ)をAIに読み込ませたいか」を明確にする必要があります。図表や複雑なレイアウトを含む日本語文書が多い場合、海外製の巨大モデルだけでなく、国産の特化型・軽量モデルの併用を検討することが現実的な解となります。第二に、AIガバナンスの視点です。顧客情報や独自の技術ノウハウを含むデータを扱う場合、オンプレミス環境で構築可能な軽量モデルは、情報漏洩リスクを低減する強力な選択肢となります。最後に、AIモデルが進化しても「データの前処理」が不要になるわけではないという点です。図表の読み取り精度が向上したとはいえ、AIが解釈しやすい社内ドキュメントのルール作り(標準化)やデータのクレンジングを組織文化として根付かせることが、中長期的なAI活用の成否を分ける鍵となるでしょう。
