スマートグラスメーカーのRokidが、Googleの「Gemini」をはじめとする複数の生成AIを自社デバイスにネイティブ統合したと発表しました。本記事ではこの動向を起点に、日本企業が現場業務などでウェアラブルAIを活用する際のユースケースと、ガバナンス上の課題について解説します。
ウェアラブルデバイスにおける生成AIのネイティブ化
AR(拡張現実)グラスを展開するRokid社は、自社の最新スマートグラスにGoogleの生成AIモデル「Gemini」をネイティブ搭載したと発表しました。さらに、OpenAIのChatGPTや、DeepSeek、Qwenといった複数のLLM(大規模言語モデル:膨大なテキストデータを学習し、人間のように自然な文章を生成・理解するAI)も併せてサポートしています。これまでスマートグラスは、主にスマートフォンやPCの拡張ディスプレイとして機能してきましたが、生成AIがデバイス側に直接統合されることで、ユーザーが見ている視覚情報や音声をAIがリアルタイムに解析し、ハンズフリーで対話的な支援を提供する「AIエージェント」へと進化しつつあります。
マルチLLM対応がもたらす柔軟性とガバナンスの課題
今回の発表で注目すべきは、単一のAIモデルに依存せず、用途やユーザーの好みに応じて複数のLLMを選択できる「マルチLLM」のアプローチをとっている点です。たとえば、高度な推論や画像解析にはGeminiやGPT-4を使い、特定の言語処理や軽量な処理には別のモデルを活用するといった柔軟な運用が期待されます。一方で、企業がこうしたデバイスを業務導入する際には新たなリスクが生じます。様々な地域の異なるベンダーが提供するLLM(DeepSeekやQwenなどを含む)にアクセスできる状態は、社内の機密情報や顧客データがどのサーバーへ送信され、どのように学習に利用されるのかというデータトラフィックの管理を複雑にします。日本企業の厳格なコンプライアンス基準に照らし合わせると、業務利用においてはデバイス内で利用可能なAIモデルを制限・監視する仕組み(MDMなどのデバイス管理)が不可欠となります。
日本の「現場」におけるユースケースと導入のハードル
日本国内において、スマートグラスと生成AIの組み合わせが最も期待されるのは、製造業、建設業、物流、インフラ保守といった「現場」の業務効率化です。深刻な人手不足の中、作業員がスマートグラスを装着し、マニュアルの確認、機器の異常診断、熟練技術者からの遠隔支援をハンズフリーで行えるメリットは計り知れません。現場の状況をカメラで捉え、AIが「次に締めるべきボルト」や「危険箇所」を音声や視覚で即座にアドバイスするようなプロダクトやサービスのニーズは確実に高まっています。しかし、導入には特有のハードルが存在します。日本の工場や建設現場では、機密保持や安全管理の観点からカメラの持ち込みが厳しく制限されているケースが多く、常時カメラやマイクが稼働するウェアラブルデバイスに対する現場の警戒感は決して低くありません。また、現場作業者のITリテラシーへの配慮や、長時間の装着に耐えうるバッテリー駆動時間と軽量性の確保など、ハードウェアと組織文化の両面で丁寧な調整が求められます。
日本企業のAI活用への示唆
第一に、AIの利用環境がPCやスマートフォンから「エッジ(現場のデバイス)」へと拡張している事実を前提に、新規事業や業務改善のロードマップをアップデートする必要があります。特にハンズフリーでのAI支援は、日本の現場課題と非常に親和性が高い領域です。
第二に、デバイスが取得する視覚・音声データの取り扱いに関する明確な社内ガイドラインの策定です。マルチLLM環境を前提とした場合、機密性の高いデータは自社専用のセキュアな環境に閉じたLLMで処理し、一般的な情報の検索にはパブリックなLLMを利用するといった、データ分類に基づいたルーティング戦略が求められます。
第三に、現場への導入にあたっては、技術の先進性だけでなく「現場の商習慣と受容性」を最優先にすることです。カメラによる監視と受け取られないよう、現場責任者との合意形成を図り、プライバシー保護機能(特定エリアでのカメラ自動オフや、映像データの即時破棄など)を備えたシステム設計を行うことが、AI導入プロジェクト成功の鍵となります。
