Ipad

なんとも巧みに話すロボットだ。GoogleのWaveNet AIプログラムは人間のような会話を生み出す。

モニカ・ニッケルズバーグ著2016年9月12日午前11時52分2016年9月15日午前11時13分

「サマンサ」のような言語能力を持つAIは、もうすぐ登場するかもしれない。（写真はHerTheMovie.comより）

音声合成技術はいまいちだ。コンピューター音声のロボットのような単調な音に、私はいつも少し耳障りに感じていた。これは、最近GeekWire Radioで、編集者のお気に入りの読書アプリを酷評した際にも話題になったことだ。

だからこそ、Googleの新しい音声生成器WaveNetは画期的な進歩と言えるだろう。Googleの人工知能部門DeepMindが開発したこのプログラムは、人間の音声録音を模倣することを学習する。

他の音声合成アプリケーションは、通常、人間の音声録音の断片を再生したり、言語規則に基づいてプログラムされたコンピューター生成の音声を使用したりします。WaveNetは、人間の録音から学習した内容に基づいて音声を生成するため、独特のリズム、男性と女性の話し方、さらには呼吸パターンまでも再現できます。

「感情やアクセントなどの追加情報をモデルに提供することで、音声をさらに多様で興味深いものにすることができる」とグーグルのディープマインドチームはブログ投稿で述べた。

WaveNet が人間のような音声を生成する仕組みについて詳しくは、Google のプログラムに関する論文をご覧ください。

WaveNetの機械学習技術は音楽にも応用できます。研究者たちは、ピアノ曲のデータセットを使ってプログラムを学習させ、独自の風変わりな楽曲を生成させました。

このプログラムはまだ初期段階だが、テクノロジー企業がより自然な音声のAIを開発するために競争する中で、Googleにとって大きな影響を与える可能性がある。

WaveNet の音声および音楽機能のサンプルをここで聞いてください。

なんとも巧みに話すロボットだ。GoogleのWaveNet AIプログラムは人間のような会話を生み出す。

You May Have Missed

小さなビジネスでも大きな影響を: 今年のホリデーシーズンはウォークスコアで地元のお店を応援しましょう

アマゾン、プライム会員向けホールフーズでの10%割引を12州に拡大

センチュリーリンクがシアトルに高速ギガビットネットワークを設置する場所はこちら

テック業界の動向：シアトルのAI専門家が国家タスクフォースに参加、Boundlessの共同設立者が退社、その他

マイクロソフトは多様性の漸進的な進歩を報告し、新しい「インクルージョン・インデックス」感情分析を発表した。

企業の売買を支援するシアトルの投資銀行が「インダストリー4.0」をターゲットとした新たなSPACを設立

スポーツ観戦の未来？スティーブ・バルマーとロサンゼルス・クリッパーズが新たな拡張現実NBA体験を発表

今週のレビュー：2016年2月7日のGeekWireで最も人気のある記事

SAPはソフトバンクの投資に続き、契約管理ソフトウェアのスタートアップ企業Icertisを支援している。

マイクロソフトとAT&Tが複数年にわたるクラウドおよび5Gパートナーシップで提携

Xbox One Eliteコントローラーは高価格にもかかわらず売り切れている

マッチの出会い系プロフィールに「スター・ウォーズ」が登場する都市といえばシアトルがトップ

元aQuantive幹部が、急成長中のオンデマンド倉庫スタートアップ企業FLEXEを率いる

You may also like...

Popular Posts

You May Have Missed