
猫の鳴き声を翻訳するアプリ「MeowTalk」は、元Alexaエンジニアの趣味のプロジェクトです。

多くの技術革新は猫の鳴き声と見なせるかもしれません。ここには、猫の言っていることを実際に理解できると主張する技術があります。
ワシントン州ベルビューに拠点を置くビジネスおよび技術ソリューション企業アクベロンのテクニカルプログラムマネージャー、ハビエル・サンチェス氏は、「MeowTalk」という猫翻訳アプリを開発し、このアプリが人々と猫の友達との関わり方を変えることを期待している。
MeowTalkはデータサイエンスと機械学習を活用し、猫の鳴き声を聞き取り、人間の言葉で翻訳します。「餌をちょうだい」「外に出して」「痛いよ」など、ペットと人間の間の垣根を取り払うことを約束します。ユーザーからの入力によって、すぐに使えるバージョンのアプリは特定の猫の鳴き声を理解できるようにトレーニングできます。
サンチェスにとって、これは音声テクノロジーに取り組むもう一つのチャンスだ ― たとえその声がただのニャーニャーという声だとしても。
「Alexaの機械学習プラットフォームチームでしばらく働いていました」と、Amazonで1年半働いたサンチェスは語る。「そこで、ソーセージがどのように作られるのか、モデルをどのようにトレーニングするのか、そしてあらゆるデータサイエンスプラットフォームとどのように連携するのかを目の当たりにしました。その直後だったので、『猫でも同じようなことができる。アプリになるかもしれない』と考えていたんです」
サンチェスは4、5ヶ月前にアクベロンでの自身のプロジェクトにゴーサインを出した。彼は猫好きの人と猫との繋がりを真剣に考えている。特にパンデミックと隔離生活で多くの人が自宅に閉じこもっている今、そうした繋がりは極めて重要だと考えている。
「このようなツールは、特に定期的に他の人と接触できない人にとって、猫との絆をさらに深めるのに役立ちます」とサンチェス氏は述べた。「ですから、猫を飼っている重要な層にとって、これは本当に画期的な出来事となる可能性があります。」

MeowTalk(iOSとAndroid対応)には、家の中で猫の鳴き声を聞き取り、その音をすべての猫に共通する10種類のインテントに分類する汎用モデルが搭載されています。初めてアプリを起動してテストした時、我が家の猫ルナが鳴いたのですが、ルナは明らかにおやつを待っているのに、アプリは「ママ」と翻訳して返しました。
猫には共通の言語はありませんが、それぞれが独自の語彙を発達させ、それを一貫して使い続けるとサンチェス氏は言います。ユーザーは、自分の猫が何を求めているのかがわかったら、MeowTalkで猫のプロフィールを作成し、鳴き声に新しいラベルを付けることができます。
アプリは新しい単語を学習し、次にその単語を聞いたときに正確に予測します。裏では、ユーザーからのフィードバックに基づいて、猫固有のモデルが今後その猫の鳴き声を理解できるようにトレーニングされています。
このアイデアは、開発中のスマート首輪などの技術機能と、より多くのレイヤーやシナリオが組み合わさることで、さらに面白くなります。Akvelon社が開発中の初期プロトタイプ段階にあるこの首輪は、猫の鳴き声を聞き取り、猫の言葉を翻訳した人間の音声を再生します。また、猫が外にいて中に入れる必要がある場合は、鳴き声を感知すると首輪が作動し、中にいる人間にテキストメッセージを送信します。
サンチェス氏は、データサイエンティストのスタブロス・ンタランピラス氏に相談しました。ンタランピラス氏は「異なる状況で発せられる猫の発声の自動分類」という研究論文を執筆し、アクベロンチームの注目を集めました。アクベロンのデータサイエンティストであるダニー・コスミン氏もこのプロジェクトに携わっており、この技術についてMediumに投稿しています。
MeowTalk は、猫の鳴き声を聞いてそれが猫の鳴き声であることを認識する Google データ サイエンス モデル、アプリの初期の猫の語彙の意図を提供する一般的なモデル、そして各猫に合わせてトレーニングされた非常に特殊なモデルを活用しています。
「この背後にある真の創意工夫は、これらすべてを結びつけ、スマートフォン上で瞬時に動作させることです。そこが大変でした」とサンチェス氏は語った。「これを実現し、動作させるのは、まるでAlexaのミニバージョンのようなものなのです。」
Amazonの音声対応AIは非常に賢いですが、猫の言葉を翻訳するわけではありません。Alexaは猫の鳴き声を出して家の中にいる猫の注意を引くことはできます(これは私たち自身のテストによるものです)。しかし、サンチェス氏によると、Amazonは人間の話し言葉や音節の理解により注力しているとのことです。
「一日中ニャーニャー鳴き続けられる。APIがないんだから」と彼はAlexaについて語った。「彼らは猫のことなんて気にしないんだ」
サンチェス氏は人生の大半を猫と共に過ごしてきた。先日のZoomビデオ通話中に、飼い猫の一匹が実験台としてオフィスをぐるぐる回っていた時、犬は確かに言葉を理解しているものの、吠えてコミュニケーションをとるほどの発声能力を持っていないとサンチェス氏は語った。
「私がよく言うジョークは、犬は人間の言葉は理解できるけど、話さないってことです」とサンチェス氏は言った。「猫は人の言うことを気にしません。もしかしたら理解しているのかもしれませんが、それをはっきりと示そうとはしません。でも、猫には明らかに独自の語彙があるんです。」
Akvelonは世界中で800人の従業員を擁し、そのうち150人はシアトルとシリコンバレーのテクノロジーハブに勤務しています。Microsoft、Reddit、DoorDashなどの企業にソフトウェアエンジニアリングソリューションを提供しています。
同社は、顧客や市場の需要を満たすため、あるいは利益を上げるために猫翻訳アプリを開発しようとしたわけではない。サンチェス氏は、この製品は創造性を奨励し、新たな道を模索する企業文化にぴったり合致していると述べた。
「これは、社内の技術力の高さを示すツールです」と彼は語った。「私たちはテクノロジー企業です。こうしたものを作り、世界と共有したいのです。」