デジタルヒューマンの未来と可能性について(勉強会アーカイブ)

こんにちは、まちのデジタル屋さん 宮原です!
先日、1月8日(木)に堺市産業振興センターで開催された「堺ベンチャー交流会」にて、デジタルヒューマンの未来と可能性についてお話しさせていただきました。
そもそも、デジタルヒューマンとは何なのか。なぜ今「デジタルヒューマン」なのか。そして、それがビジネスにどのような変革をもたらすのか。 当日の講演でお話しした内容を、スライドの要点を振り返りながらご紹介します。
※本記事では、当日お話しした内容をできる限りそのままの流れでまとめています(表現は一部調整しています)。正直かなり長く、話題も広範にわたるので、興味のある部分だけ拾い読みしていただければ嬉しいです!
そもそもデジタルヒューマンとは何か?
まずは「デジタルヒューマンとは何か」を定義しましょう。実のところ、その定義は文脈や企業によって様々です。

そこで、この勉強会ではAIと3Dアバターを組み合わせた人間らしい振る舞いができる対話システムと定義します。ただ、3Dアバターと限定していますが実際のところは、もう少し広く 「自然な振る舞う人間を描画する仕組み」 と考えたほうがいいと思います。
実際、今回の勉強会でも後半では動画生成AIを使ったデジタルヒューマンについて言及しています。
デジタルヒューマンの社会実装が進む

大前提として、社会におけるデジタルヒューマンの実装は着実に進んでいます。皆さんも、Webサイトやショッピングセンター内の案内システムなどで、3Dのキャラクターに接客してもらう機会が1度や2度はあるのではないでしょうか。

私はデジタルヒューマンの世界において2025年が大きなターニングポイントだったのではないかと考えています。たとえば大阪関西万博において、筑波大学の落合教授がプロデュースした「null²パビリオン」では、自身を再現したデジタルヒューマンと対話する展示が行われました。
また大阪ヘルスケアパビリオンでも、自身をデジタル上に再現し、ディスプレイの中で他者と交流したり、ダンスをしたり、あるいは年老いていく姿を見せる――そんな体験を、多くの方が目の当たりにしました。

その他にも、冒頭で私はデジタルヒューマンを「AIと3Dアバター・音声」によって構成するものと定義しましたが、それらに関連する技術が非常に多く発表されたり、あるいは性能が向上した年だったように思います。
画像で示しているのはあくまで一例ですが、スマホ一台で自分そっくりの3Dアバターを構築できたり、画像生成AIの進歩によって3Dアバターの構築コストが下がったり…。音声合成や動画生成AIにおいても、技術者ではない方が簡単に使えるようなソフトウェアが広まった年でした。
ヒューマン・デジタルツインが作る未来
さらに2025年は、ビジネスの現場で「デジタルツイン」という言葉が語られるようになった年でした。これは一言で言えば、 「現実世界のあらゆる要素を、デジタル空間の中に再現する技術」 を指します。
たとえば、工場の機械をデジタル上にそっくりそのまま再現するケースが分かりやすいでしょう。デジタル上に機械を設置し、「どう動けば効率的か」「いつ故障しそうか」を何万回も試行錯誤させて学習する。その中で得られた最適な答えを現実の機械に反映させる。こうした効率化が、実用レベルで広まりました。

この「機械をデジタル上に再現する」という考え方を、さらに一歩進めて「人間」へと適応させたものが 「ヒューマン・デジタルツイン(HDT)」 です。
これまでのデジタルヒューマンが、あらかじめ決められた動きをする「精巧な人形」のような模倣だったとするなら、ヒューマン・デジタルツインはそこに 「本人の判断基準や心の動き」という命を吹き込むプロセス だと言い換えられます。
具体的には、人間の骨格や表情筋の動きといった身体的な「ハード面」だけでなく、心拍数や脳波といった生体情報、さらにはその人の喋り方や口癖、価値観といった「ソフト面」の情報までをデジタル上に写し取る。
この技術が進化し、見た目も中身も本人と遜色ない「デジタルクローン」が完成すれば、私たちの生き方は劇的に変わるはずです。あなたが眠っている間や別の仕事をしている間に、あなたの意思を継いだ分身が、身の回りの手続きや顧客対応を完璧にこなしてくれる。そんな、肉体という制約から解放された未来だって、ほんの数十年先には訪れているはずです。
なぜ今、デジタルヒューマンなのか?〜情報の価値暴落時代〜
個人の完全な再現はまだ少し先の話ですが、もう少し身近なビジネスの現場では、すでにデジタルヒューマンが必要とされ始めています。

その背景にあるのは、私たちがたった今置かれている「情報の洪水」という状況です。
生成AIの登場により、かつて価値のあった「知識があること」「正解を知っていること」というアイデンティティは、GPTやGeminiにあっという間に奪われてしまいました。その結果、「情報の価値」そのものが暴落してしまったのです。

どこを切っても同じような「正解」が返ってくるコモディティ化した世界。そこで最後に差をつけるものは何か。
それは、「一次情報」「体験」、そして「その人(その会社)らしさ」です。

Googleが検索エンジンにおいて評価するコンテンツとして「E-E-A-T(経験・専門性・権威性・信頼性)」の概念を示しましたが、これは「何を言うか(情報)」よりも「誰が、どう語るか(背景)」が問われる時代に突入したことの証左でしょう。
「いい話」だけでは売れない? ストーリー戦略の罠

「じゃあ、想いを込めて自分たちらしさを発信すればいいのか?」 というと、そう単純ではありません。ここに非常に参考になる失敗例があります。
コカ・コーラ社がかつて展開したオウンドメディア、「コカ・コーラ・ジャーニー」です。 この取り組みが始まった当時も、Webサイトが乱立し、現在の生成AIブームに近い「情報の飽和」が起きていました。そこでコカ・コーラ社は、製品を直接売るのではなく、自社のこだわりや背景にあるストーリー(=らしさ)を訴求することで、選ばれる理由を作ろうとしました。いわゆる「コンテンツマーケティング」の走りです。
しかし、これは結果的にビジネスとして持続しませんでした。なぜなら、あくまで企業側からの一方的な「いい話」の発信に留まってしまったからです。
記事を読んだユーザーは「いい話だね」と感動はします。しかし、 「感動するタイミング」と「商品を手に取る(購買)タイミング」があまりにも乖離していた のです。「いい会社だね」という共感だけで終わってしまい、その熱が冷める前にアクションへ繋げることができなかった。双方向のつながりや、深い顧客関係を構築できなかったことが、売上に結びつかなかった最大の要因です。
天下のコカ・コーラ社といえども、費用対効果が見えない施策に予算を出し続けることはできません。結果として、メディアは廃止や方針転換を余儀なくされました。

では、どうすればよかったのでしょうか?
「らしさ」を伝えつつ、しっかりとビジネス成果(売上)につなげるには、以下の3つを満たす必要があります。
- 成果が定量的に測れること (購買までの距離が近い)
- 双方向のコミュニケーションであること (一方通行の押し付けではない)
- 施策単体で顧客の課題を解決できること (実利がある)
これらを全て満たす解決策として、提案したいのが「デジタルヒューマン」なのです。
記事を読むだけのメディアとは異なり、デジタルヒューマンは 「対話」を通じてその場で顧客の相談に乗り(実利)、同時に「温度感」を伝え(らしさ)、そのまま予約や購入まで案内する(成果) ことができます。
「感動」と「購買」の距離をゼロにする。それが、デジタルヒューマンがもたらすビジネスの変革です。
効率化の先にある「無機質」の壁
とはいえ、これまでの話は一見、AIチャットボットを導入しても成立するように感じられます。相互に対話ができますし、購買との距離を近めることも可能です。あえてデジタルヒューマンである必要性はどこにあるのでしょうか。

実際に、多くの企業がチャットボットを導入し、効率化を進めています。確かに便利ですが、皆さん、ふとこう感じる瞬間はないでしょうか?「便利だけど、なんか違う」「どこか冷たい」と。高級なお店では、敢えて人間が対応するホスピタリティを売りにするところも出始めています。
つまり単に人間をAIに置き換えるだけでは、無機質で冷たい印象になってしまうのです。

例えばこんなことを社外に発信している企業がいたとします。
「発展途上国にはゴミの山ができており、そこで体を壊す人がたくさんいる。だから私たちはゴミの排出をなるべく減らす取り組みを行っています」
言うまでもなく、素晴らしい取り組みですよね。ただ、このような素晴らしい発信をしている企業はこの世界に数多く存在するわけです。そうした中で企業がどれほど本気で取り組んでいるのか、どれほどの思いを込めているのかはなかなか顧客に伝わりません。
このように人を減らし業務を効率化するということは、企業が無機質化してしまうリスクも孕んでいます。テキストだけの発信や自動応答では、「温度」は伝わりません。この「無機質な対応」こそが、顧客との関係構築を阻む壁であり、ブランドの個性を消し去ってしまいます。

ここで登場するのが「デジタルヒューマン」です。
デジタルヒューマンは、言ってみればAIに「見た目」と「声」という感情を乗せるための装置です。一見、効率化などにおいて不要だと思えるこれらの要素が、単なる「情報の仲介」を「思い(温度)の仲介」に変えます。デジタルヒューマンは悲しそうな顔と声で心からの共感を示し、不条理に対して静かな怒りを示し、本当に生き生きと未来について話すことができる。
これらによって、企業が何を大事にして何にどれほどの熱量を込めているのかを表現できるのです。

デジタルヒューマンの価値の本質はここにあります。これまでのホームページや広告やチャットボットが行っていた「自動応答」を、企業の顔としての「接客」へと進化させるのです。企業の熱を表現しながら、顧客に寄り添える存在、それがデジタルヒューマンです。

コカ・コーラ・ジャーニーが目指したけれど届かなかった未来。自分たちらしさを適切に伝えながら業務効率化を実現し、かつ双方向のコミュニケーションでより深い関係値を築きつつ最終的な購買に繋げる。適切な設計を行えば、そのような未来を実現することもできます。
デジタルヒューマンを形作る技術

デジタルヒューマンを形作る技術はいくつかありますが、現在は「3Dモデル」を使用するか、「動画生成AI」を使用するかの2つが主流です。

その中でもリアルタイムで自然な対話を行おうと思うと、やはり3Dアバターを使用するのが本筋でしょう。というのも、皆さん既に動画生成AIを試したことがある方も多いと思いますが、あれは数秒の動画を生成するのにも1分、2分といった時間がかかってしまいます。デジタルヒューマンは人間のように即座にコミュニケーションできるのがポイントなので、必然的により高速でかつ軽量で動く3Dアバターを使用する流れになっています。

ただし、この流れは今後大きく変わっていきます。現在、3Dアバターと動画生成AIのそれぞれの良さを組み合わせた「ハイブリッド型」のデジタルヒューマンが生まれつつあるからです。
詳しい動作は、私のFacebookの投稿を見ていただけたらと思います。
ハイブリット型のデジタルヒューマン
これは3Dアバターを使ったデジタルヒューマンのように、 知能・音声・人間を描画する部分を分割する考え方 です。上記の動画では、OpenAIのAPIを使用し音声を生成したら、その音声から口回りだけをAIで生成して貼り付けるということをしています。
この技術の強みは、実際の人物写真などをそのまま流用できるため低コストで始められるうえ、ゼロから動画生成を行うよりも非常に高速かつ低負荷で実行できる点です。3Dアバターを使用する場合、制作するだけでも数十万から数百万の費用がかかってしまうことを考えれば、今後はこの ハイブリッド型がメインストリームになっていく と考えるのが自然でしょう。
未来に備えよう
日進月歩の技術発展により、デジタルヒューマンを立ち上げて動かす手間は徐々に小さくなっています。またヒューマン・デジタルツインのような新しい考え方も組み合わされることで、私たちの生活により深く入っていくこととなるでしょう。

将来的には、「企業らしさを表現するもの」といった枠を大きく超えて、あなた自身として振る舞うデジタルヒューマンも当たり前のように使われていくはずです。
ではそうした未来に私たちはどういった備えをすればいいのでしょうか。

それは、 できる限り、あなたらしさ、そして企業らしさを情報として残しておくこと です。個人であれば自分が何を考えてどう判断するのか、口癖や言い回しなどの声の情報なども当然残しておいた方がいいでしょう。企業であれば理念やそこに至るまでの原体験、また現在徐々にAIを使った「暗黙知」の情報化も進んでいますが、そういった部分にも今のうちから着手していく必要があります。
これらの情報を、テキスト・動画・音声・画像といった様々なフォーマットでより多く残すことが生存戦略につながります。なぜならば今後AIがあなたやあなたの企業を模倣した時、正確な模倣を行うためのデータがなければ、 あなたではない「誰か」のようなデジタルヒューマンが、あなたの顔をして、この情報の海を独り歩きしてしまう ことになるからです。
小さなことからで構いません。会議の録音を残しておくとか、YouTubeやPodcast、SNSなどを使用して自分たちの思いを発信していくこと。そうしたことから、始めていきましょう。

まとめます。 私たちはAIに顔と声を与えてデジタルヒューマンを形作りました。この流れは今後際限なく進んでいくので、今のうちから備える必要があります。一方で、きちんと「らしさ」を残す取り組みを行っていた企業にとって、この流れは強い追い風となることでしょう。
恐れず、正確に見極めて適切な対応をとっていきましょう。
もしデジタルヒューマンの構築に興味があれば、まちのデジタル屋さん 宮原までお気軽にご相談ください。最後までお読みいただきありがとうございました。
課題整理から実装まで、状況に合わせて伴走します。