
音声は良いが、シナプスはジェラードというロボットを導入し、より文脈的な認識力を見せつける
カート・シュロッサー著

音声アシスタントの普及は、私たちの生活環境を間違いなく変えました。Alexa、Siri、Googleアシスタントなど、音声は進化するテクノロジーの大きな一部として認識されるようになりました。
シアトルに拠点を置く Synapse 社は、会話が音声だけで完結することに満足せず、より状況認識力の高いインターフェースを使用することで、人工知能を実際の人間同士のやり取りに近づけることができると考えています。
「まるで壁の向こう側にいる人と話しているようなものです。追加の文脈は一切ありません」と、Synapseのエンジニアリング担当副社長、ジェフ・ヘバート氏は音声アシスタントについて語った。
そこでヘバートと仲間たちは、ジェラルドに会って、会社の実力を見せてもらいたいと思っています。タキシード姿のロボットは実際の製品ではありませんが、その能力は本物です。機械が物理的な環境を学習し、音声コマンドだけでなく人間のジェスチャーも理解する様子を垣間見ることができます。
ビデオではジェラード氏の作業の様子が紹介されているが、ヘバート氏は、3D および空間マッピングを実行できる部屋の壁の一点から簡単に結果を得ることができると述べた。
「空間マッピング、深度マッピング、音声認識、ジェスチャー認識といった構成要素はすべて、今日の製品やモノの中に既に存在しているのです」とヘバート氏は述べた。「私たちが示そうとしたのは、これらをこのように組み合わせることで、デジタルアシスタントなどの未来像がどのようなものになるのか、という点です。」
ジェラードのような技術は、まず消費者向け市場から登場し、家庭内の照明やテレビ、音楽、その他の機器のスイッチを入れたり、動画のように失くし物を探すのを手伝ったりするだろうと予想されています。この技術は市場の他の分野にも確実に浸透し、ヘバート氏は、数年後には医師の診療所でこの種のアシスタントが見られない日が来るかもしれないと述べています。また、産業現場では、この技術によって画面を見る手間が省け、作業効率の向上と安全性の向上にも役立つでしょう。
プライバシーの懸念について、ヘバート氏は、ジェラルドとのやり取りに関わるすべてのビデオ処理は「非常に強力なInvidiaの処理エンジン」を使用して機内で行われていることを強調した。クラウドに情報が送信されることはない。
2002年に設立され、2016年にケンブリッジコンサルタンツに買収されたシナプスは約160人の従業員を抱え、1年余りジェラードの開発に取り組んでいる。
このデモは、同社のブランド認知度を高めるとともに、同様のシステムやこの技術を利用したシステムを構築する潜在的な機会をもたらすことが期待されます。
「マシンビジョンや深度マッピング、エッジ処理の要素があるため、自動運転車の開発に取り組むことができます」とヘバート氏は一例として述べた。