
メディアの未来はインテリジェントかつインタラクティブ:AIはコンテンツの消費方法をどう変えるのか

編集者注: これは、Allen Institute for AI の元 CEO、シアトルのスタートアップ Vercept の共同設立者、ディープフェイク識別を行う非営利団体 TrueMedia.org の創設者である Oren Etzioni 氏によるゲスト投稿です。
私たちは、学術論文からポッドキャストやビデオまで、私たちが読む、見る、聞くあらゆるものをインテリジェントでインタラクティブなメディアに変える AI 革命の瀬戸際にいます。
AIによって私たちがメディアとリアルタイムでやりとりできるようになるにつれ、TikTokやSpotifyからニューヨーク・タイムズやウォール・ストリート・ジャーナルに至るまで、メディア大手は進化するか退化するだろう。
私たちはメディアを妨害し、尋問し、反論し、さらにはリアルタイムで修正することさえするでしょう。コメンテーターたちは私たちに個別に応答し、放送はAIを介した対話へと変化します。
マイクロソフトのCEO、サティア・ナデラ氏は最近、GeekWireにこう語った。「私にとってポッドキャストを聴く最良の方法は、実際にポッドキャストを聞くことではなく、通勤中にCopilotを使ってトランスクリプトと会話することです。」同様に、車内での受動的なリスニングを、知識豊富なチャットボットとの能動的な対話に置き換えることが増えています。通勤者にとって、インタラクティブな未来はすでに到来しているのです。
リード・ホフマン氏がこの短い動画で紹介した「AIツイン」が示唆しているように、著名人はアバターを使って観客と交流するようになるだろう。既存のコンテンツで訓練されたAIツインは、人間とほとんど区別がつかなくなり、その制作コストはすでに急落している。
2023年、ソーシャルメディアのインフルエンサーであるキャリン・マージョリーは 、 CarynAIと呼ばれるAIツインを作成しました。これにより、ファンはまるでキャリンと直接話しているかのように、1対1の音声チャットを楽しむことができました。このチャットボットは、1分あたり1ドルのチャット料金を請求することで数万ドルの収益を上げていたと報じられていますが、性的に露骨な会話を行ったため閉鎖されました。
Instagramで700万人以上のフォロワーを持つLu do Magaluのような、コンピューター生成のバーチャルインフルエンサーは、単に配信するだけの活動にとどまっていますが、彼らの未来はインタラクティブです。架空のキャラクターから歴史上の人物まで、AIが生成した幅広いペルソナとユーザーがチャットできるプラットフォームであるCharacter.AIは、2022年にローンチされ、瞬く間に巨大なユーザーベースを獲得しました。2024年には、世界中で2,000万人以上のアクティブユーザーを抱えたと報告されています。

現在、企業はウェブサイトと原始的なチャットボットを運用していますが、近い将来、TavusやCreatorsagiといったスタートアップ企業が先導するように、インタラクティブなブランドボイスがこれらに付加されるでしょう。2024年、私はCreatorsAGIの創設者であるジョセフ・シロシュ氏と協力し、TrueMedia.orgを表現するチャットボットの学習を行いました。ChatGPTのようなモデルにTrueMedia.orgに関する多数のインタビューや記事を入力したところ、ディープフェイクに関する質問に私たちの「声」で高い精度で迅速に回答できるようになりました。コストと労力は最小限で、結果は説得力のあるものとなりました。
ウェブ検索は、ChatGPT、Perplexity、そしてGoogleのGeminiによる質問応答によって既に置き換えられつつあります。回答がAIによって生成された要約であることについては多くの議論がなされていますが、 インタラクティブな 性質こそが、その魅力の重要な側面です。
Perplexityは既に、ニュース記事に関する補足的な質問をユーザーに提供しています。学術検索エンジンSemantic Scholarでは、研究者がコーパス内の個々の論文に対して自由形式の質問をすることができます。例えば、Green AIという論文に「Green AIはどのようにしてAIをよりインクルーシブなものにするのか?」と質問すれば、数秒以内に簡潔な回答が得られます。しかし、その回答は単一の論文に基づいており、論文の著者とのリアルタイムの会話の一部ではありません。今のところは。
印刷機の発明以来、そしてそれ以前から、テクノロジーは情報と娯楽の制作と配信に革命をもたらしてきました。テレビの登場と同時にラジオが生き残ったように、従来の消費形態は一般的に生き残りますが、新しいアプローチは爆発的な人気と影響力を増しています。そのため、リラクゼーションや娯楽のための受動的な動画視聴は今後も続くでしょうが、コンテンツとの能動的なインタラクションは、より魅力的な要素を伴い、時間の経過とともにそれを凌駕していくでしょう。
私はこの新しいタイプのリアルタイム・インタラクティブ・メディアを「会話型メディア」と呼んでおり、ChatGPTの高度な音声モードで既にそのプレビューを提供しています。私たちは転換点に近づいており、強大なTikTokでさえ、YouTube ShortsやInstagram Reelsではなく、インタラクティブで視覚的、そして会話型のメディアによって破壊されるでしょう。
教育分野では、カーンアカデミーのKahnmigoやマキシマルラーニングのMaxといったインタラクティブなAI搭載チューターは、静的な教科書よりもはるかに魅力的です。同様に、シアトルを拠点とするAIコミュニケーションコーチYoodliは、リハーサルしたスピーチの完了時に分析とフィードバックを提供するという従来の方法から、インタラクティブなアバターベースのロールプレイングへと進化を遂げています。教育とトレーニングの未来においても、会話が重要な要素となることは明らかです。
会話型メディアがその可能性を最大限に発揮するには、いくつかのハードルを克服する必要があります。
まず、AIとのリアルタイムインタラクションは、より高速かつ安価にならなければなりません。次に、視覚的なインタラクションを微調整する必要があります。そうすることで、不気味の谷現象、つまり現在のソーシャルメディアのアバターが人間に似ているのに人間とは程遠い顔から感じる不安感に陥るのを防ぐことができます。そして最後に、この新しいインタラクションの形態について、一般の人々に啓蒙する必要があります。
最後に、ネガティブなユースケースにも対処しなければなりません。インタラクティブメディアの説得力はかつてないほど強まるでしょう。トランプ大統領の演説は多くの人が説得力を感じていますが、彼のAIの双子があなたと目を見つめながら一対一で会話をしたらどうなるでしょうか?イーロン・マスクのディープフェイクはすでに様々な詐欺に利用されていますが、インタラクティブな手法による最悪のケースはまだこれからです。残念ながら、AIによる偽造はますます検知が困難になるでしょう。
あらゆる技術の進歩と同様に、私たちは良い面と悪い面の両方を考慮し、備えなければなりません。