Vision

このボットはホットな曲を演奏します: Super Hi-FiとWellSaid LabsがAIを使ってリアルなDJを作成します

このボットはホットな曲を演奏します: Super Hi-FiとWellSaid LabsがAIを使ってリアルなDJを作成します
マイク付きロボット
ロボットによる乗っ取りのプレイリストは何でしょうか?(Bigstock Illustration / © mast3r)

フー・ファイターズの曲からスマッシング・パンプキンズに曲を変えると、アンディは典型的なオルタナティヴ・ロックのDJのように聞こえるが、彼のキャッチフレーズは完全に非人間的だ。

「一日を元気づける一杯がほしいと思ったことはありませんか? まさにそのために私たちはいるんです。そんな悲しい顔を一変させ、元気を出してあげるお手伝いをするのが私たちの使命です」と彼は言う。「そう、私はロボットかもしれないけど、それでもロックは大好きです」

ロボットへの言及は、彼のお決まりのDJフレーズへのオマージュではありません。ある意味、Andyは本当にロボットなのです。ANDY、つまり人工ニューラルディスクジョッキーのことですシアトル拠点を置くWellSaid Labsと、ロサンゼルスのAI中心の制作会社Super Hi- Fiのおかげで、ANDYはまもなくあなたの近所のストリーミング音楽サービスに登場するかもしれません。

「Super Hi-FiのAIは、ベテランのオンエアDJと同等のスキルを持っています」と、Super Hi-Fiの共同創業者兼CEOであるザック・ザロン氏はGeekWireへのメールで述べた。「AIは、あらゆる瞬間に最適なコンテンツを選択し、他のコンテンツや音楽とシームレスに組み合わせ、完成度の高いリスニング体験として出力することができます。」

アンディの声を生身のDJの声と区別するのが非常に難しいのは、WellSaid Labsの音声合成ソフトウェアのおかげです。

「スーパーHi-Fiの洗練された自動制作技術で提供される当社のクラス最高の音声合成技術は、ストリーミングオーディオ、ラジオ、デジタルフィットネス、オーディオニュース、小売マーケティングなどの分野で新たな可能性を生み出します」とウェルセイドのCEO、マット・ホッキング氏は本日のニュースリリースで述べた。

Andy の紹介から始まる、次のサウンド サンプルを確認してください。

さて、ちょっと元気を出してみます。

アンディは『2001年宇宙の旅』のオーディオクリップを引用して次のように語る。

コマーシャルの時間です(電話番号の数字を削除した偽の広告です)。

今日の締めくくり: 「同じ人工的な時間、同じ人工的なチャンネル」:

WellSaid Labsは、シアトルのアレン人工知能研究所から2019年にスピンアウトし、誰でもカスタマイズ可能な超リアルな音声アバターを作成できる人工知能ソフトウェアの商用化をミッションとしています。そのため、このベンチャーがSuper Hi-Fiの注目を集めるのは時間の問題でした。

「Sonos、Peloton、iHeartといった企業は、Super Hi-Fiを活用して自動化を実現しています」とZalon氏は述べた。「実際、私たちはすでに毎月10億件以上の商用AIによる『判断』を行っています。」

Super Hi-Fiのソフトウェアは、楽曲、インタビュー、DJの音声トラック、効果音、天気予報、ニュース速報などを組み合わせ、顧客に統一されたリスニング体験を提供します。「WellSaidの素晴らしい点は、声のリアルさです。これにより、これらの制作されたあらゆる体験で使用できる音声コンテンツを、リアルタイムよりも速く制作できるようになりました」とザロン氏は述べています。

Zalonは、WellSaidとの提携は非常に新しいため、「両社のサービスを併用している共同顧客をまだ発表していない」と述べた。

「しかし、すでにかなりの関心が寄せられており、今後数ヶ月の間にさらに多くの情報をお伝えできると期待しています」と同氏は付け加えた。

ANDY は WellSaid が Super Hi-Fi と共同で作成したアバターの名前ですが、すべての Andy が同じように発音される必要はありません。

「WellSaidの他のアバターと同様に、地域ごとのアクセントやあらゆる言語に合わせてカスタマイズできます」と、WellSaidの成長責任者であるマーティン・ラミレス氏はGeekWireへのメールで述べた。「声の個性、トーン、質感は、対象となるコンテンツに合わせて設計されています。例えばラジオの場合、クラシック音楽局とヘビーメタル局のスタイルのニュアンスの違いを思い浮かべてみてください。」

WellSaidのホッキング氏は「どんな顧客でも、独自のコンテンツ体験のためにAI DJのチームを組むことができる」と語った。

ザロン氏は、ANDY の目的は人間に代わるものではなく、人間に役立つことだと強調した。

「私たちはこれを、単なるコスト削減の機会ではなく、可能性を広げる機会だと考えています」と彼は述べた。「確かに、膨大な音声ニーズと膨大な制作要件を考えると、効率性という点で有利な点はあります。しかし、私たちの目標は、音楽サービスにこれまでにない機能を提供することです。」

この技術は、新たなタイプのオーディオサービスにつながる可能性があります。「数百万人のリスナーがそれぞれ独自の名前と興味を持つ音楽サービスを想像してみてください」とザロン氏は言います。「人間が、そのオーディエンスのほんの一部でも満足させるのに十分な音声コンテンツを効率的に作成することは現実的ではありません。しかし、今や選択肢は無限にあります。AIを使えば、信じられないほどリアルで信憑性のある音声を作成でき、今日の音楽プレイリストを真の『ストーリーテリングデバイス』に変えることができます。これにより、現状では非常に静的な体験に、全く新しいレベルの感情の深みをもたらすことができます。」

過去や現在の声のように聞こえる AI ナレーターを作成することさえ可能です。たとえば、オーソン・ウェルズが「宇宙戦争」の続編をナレーションしたり、ロボットのライアン・シークレストがトップ 40 を朗読したりすることができます。

「ぜひ検討してみたい」とホッキング氏は述べた。「もちろん、本人またはその信頼できる遺産相続人の明確な同意と関与があればの話だが、AI音声アバターの作成プロセスだけでなく、AIがどのように使用される予定なのか、誰が使用しているのかも透明性が保たれる必要がある」

ラミレス氏も同意した。「WellSaidの音声は、利用者の明確な情報に基づく同意なしには決して作成しません。これは私たちの『AI for Good』という誓約に反します」と彼はメールで述べた。「私たちの指針と価値観に基づき、私たちの仕事がすべての人に利益をもたらし、害を及ぼさないよう、私たちは非常に懸命に取り組んでいます。」

そうは言っても、ライアン・シークレストは AI の代役が手元にいることを喜ぶかもしれない。

「トレードマークであるラジオパーソナリティのバーチャル版があれば、タレントたちは一時的な広告読み上げなどの商業的機会を収益化しつつ、創作活動にもっと時間を費やせるようになるだろう」とラミレス氏は指摘した。

これはオーディオの新時代の幕開けなのか、それとも現役の声優陣への警告なのか? アンディがシンセサイザー風の締めくくりで言うように… 乞うご期待。