Ipad

Amazon の新しい DeepLens カメラをテスト: この 249 ドルのデバイスは本当に日常の物体を認識できるのか?

Amazon の新しい DeepLens カメラをテスト: この 249 ドルのデバイスは本当に日常の物体を認識できるのか?

ナット・レヴィ

AWS DeepLens カメラ。 (GeekWire 写真/ナット レヴィ)

Amazon Web Services が、物体認識用の機械学習モデルを実行する 249 ドルのプログラム可能なビデオカメラ DeepLens を初めて公開してから 7 か月が経ち、ついにこのデバイスが登場しました。

木曜日に出荷開始となるこのカメラは、Amazonの強力な機械学習機能をすべての開発者に提供することを目的としています。Intel Atom X5プロセッサーを搭載したDeepLensは、顔や物体を認識し、テキストを読み取るなど、さまざまな機能を備えています。

発売前夜、GeekWireは昨年ラスベガスで開催されたAWS re:Inventカンファレンスで初めて発表されたこのデバイスを実際に試す機会を得た。Amazon本社まで足を伸ばし、ドップラービルの会議室に入った。小さな白いカメラはすでに端末に接続され、私が操作するのを待っていた。近くのテーブルには、おもちゃのボート、猫と犬のぬいぐるみ、ワインボトルなど、後ほど登場する様々なアイテムが置いてあった。

見た目も美しい小型デバイスです。高さ4.5インチの筐体に、4メガピクセルの正方形カメラが搭載されています。背面にはUSB、microHDMI、スピーカー、そしてmicroSDカード用のポートがあります。モデルとコードを保存するための8MBのメモリを搭載しています。私が使っていたデバイスは、しばらく動作させるとかなり熱くなるので、取り扱いにはご注意ください。

DeepLensは開発者向けのデバイスであることに留意してください。日常的なユーザー向けにすぐに使えるアプリケーションもいくつか用意されていますが、Amazonの機械学習機能を活用したい、ある程度の技術スキルを持つ方こそがDeepLensを最も活用できるでしょう。また、デバイスにデプロイされたプロジェクトのストリームを視聴するには、マイクロHDMIケーブルと、キーボードとマウスをUSB接続する必要があります。

スワミ・シヴァスブラマニアンとジョティ・ヌークラが手ほどきをしてくれた。(GeekWire Photo / Nat Levy)

DeepLensのツアーは、Amazon Machine Learning担当バイスプレジデントのSwami Sivasubramanian氏とAWSシニアプロダクトマネージャーのJyothi Nookula氏が案内してくれました。テクノロジー業界を取材しているにもかかわらず、私のコーディング経験は記事に画像やリンクを追加することから始まり、終わるので、彼らには大変な仕事が待ち受けていました。

Nookula氏によると、DeepLensは機械学習の経験が全くない開発者も含め、あらゆるスキルレベルの開発者が利用できるように設計されているという。Amazonは、ユーザーが箱を開けて10分以内に最初のディープラーニングモデルを展開できると誇っている。

「ボタンをクリックできれば、それで問題ありません」とヌークラ氏は言う。「だからこそ、サンプルプロジェクトを用意しているのです。」

セットアップはスムーズで、サンプルプロジェクトをデバイスにデプロイするのも簡単でした。しかし、デバイスをオフィスに持ち帰った際、自分のコンピューターにデバイスを接続してアプリケーションをストリーミングするための適切なケーブルがありませんでした。

セットアップ手順をひと通り確認した後、最初に試したDeepLensプロジェクトは、あらかじめプログラムされた物体認識プログラムでした。カメラの電源を入れると、私を人物として認識し、おもちゃの物体もいくつか認識しました。ワインボトルの認識はうまくいかず、代わりにその後ろにあるテーブルに焦点を合わせました。

このデバイスは、物体の名称に加えて、DeepLensが認識した物体が実際にその物体である確度をパーセンテージで表示します。その他のすぐに使えるアプリケーションでは、人物だけでなく犬や猫の顔も認識でき、ギター演奏などの様々な動作を識別したり、写真に視覚効果を加えて動画に重ね合わせたり、HBOのドラマ「シリコンバレー」を彷彿とさせるように、ある物体がホットドッグかどうかを判別したりすることもできます。

DeepLensは、鉢植えなど一部のものをはっきりと認識しましたが、他のものはそれほど鮮明ではありませんでした。(GeekWire Photo / Nat Levy)

このデバイスの機能については限られた範囲しか確認できませんでしたが、この種の技術の可能性は容易に理解できました。小売店は、この技術を使って一日を通して来店客数をカウントできるでしょう。あるアプリケーションは、侵入の兆候となる可能性のある見知らぬ人の顔を認識できます。最近行われたDeepLens開発者コンテストでは、児童書を読み上げるプロジェクトで優勝者が栄冠を手にしました。

アマゾンで12年間勤務するシヴァスブラマニアン氏は、シアトルの東約24キロにあるワシントン州サマミッシュ市に住んでいます。この町はクマの目撃情報が多いことで知られており、シヴァスブラマニアン氏はクマを認識し、その存在をテキストメッセージで知らせるプロジェクトを構築しました。

シヴァスブラマニアン氏は、このカメラはAWSがクラウドコンピューティングで成し遂げたのと同じ、機械学習におけるミッションの一環だと述べた。つまり、世界最大級のテクノロジー企業の一つが提供する強力なツールを、あらゆるスキルレベルの開発者に提供するというものだ。DeepLensは、開発者にAmazonのエコシステムへの新たな入り口を提供し、プラットフォームの他の部分に展開されている多くのツールと同じものを利用することができる。

カメラは、このような壮大なアイデアの非常に具体的な応用例です。シヴァスブラマニアン氏によると、Amazonが複数の候補の中からこのデバイスを選んだのは、その視覚的な性質が開発者にとって魅力的だったからだそうです。

「開発者は、デバイスを実際に使ってソリューションを構築するのが大好きです」と彼は言います。「実際にデバイスに触れてプログラミングし、アプリケーションを構築し、それを追跡して友人や家族に見せることができるようになると、開発者はさらに興奮します。」

DeepLensはAmazonが初めてカメラ分野に進出したわけではありません。Echo ShowとEcho Lookはどちらもカメラを多用しており、Amazon Cloud Camは配達員が家の中に荷物を届けられるプログラムの一環です。

DeepLensは美しいデバイスで、すぐに使える楽しい体験が満載です。しかし、その可能性を最大限に引き出すには、ある程度の技術的なスキル、あるいは少なくともすべてをやってくれる友人が必要です。