
よりスマートなスマートフォン?10代の起業家が新アプリSmartLensを「視覚世界のShazam」と構想
カート・シュロッサー著

マイケル・ロイゼンがまた活躍している。シアトル在住の18歳のソフトウェア開発者兼起業家である彼は、新たな会社を設立し、本日iOS向けの新しいアプリをリリースした。7本目となる。
アプリストアの説明によると、SmartLensはスマートフォンを検索ボックスに変えるとのことだ。ロイゼン氏はGeekWireに対し、このアプリを「ビジュアル世界のShazam」と捉えたいと語った。これは、音楽の断片を聴くだけで曲名を認識できるアプリを指している。
「両親と私はいつもハイキングに出かけて、様々な植物や動物の識別に挑戦するのが大好きでした」と、シアトルのブッシュスクールの4年生で、かつてGeekWireの「今週のギーク」に選ばれたロイゼンは語ります。「しかし、当時はオフラインで物体を識別できるアプリはありませんでした。約1年前、AIの道を歩み始めた頃、まさにそれができるアプリを作ろうと決意しました。目標は、あらゆるもの(商品、動物、ランドマークなど)を識別でき、しかもオフラインでも多くの物体を認識できるアプリを作ることでした。」

SmartLensは複数の畳み込みニューラルネットワークを採用しており、ロイゼン氏によると、オフラインで実行することでクラウドベースのモデルよりも認識時間が大幅に短縮されるという。このアプリは、家具から珍しい動物まで、オフラインで正確に17,527個の物体を認識できる。アプリのサイズが大きくなりすぎないようにするため、製品認識にはインターネット接続が必要だという。
SmartLensが商品を認識すると、ワンタップで購入できます。動物、ランドマーク、食べ物、絵画などを認識すると、Wikipediaの説明が表示されます。企業を認識すると、レビューが表示されます。

ロイゼン氏はニューラルネットワーク、インターフェースデザイン、アイコンなど、アプリを自ら開発しました。友人たちはテストを手伝い、インターフェースに関するアドバイスも提供してくれました。彼はコンピュータービジョンに関する研究論文を大量に読み、そこから得たインスピレーションを独自のモデル(特許出願中)に活かしました。ロイゼン氏はこのプロジェクトに1,000時間以上を費やしています。
彼は11歳でアプリを作り始めて以来、たくさんのアプリを作ってきました。
- ASprit4Mars(プラットフォームゲーム)
- Top Verse(トップソング、映画、テレビ番組の情報を表示するアプリ)
- アーケード忍者(別のゲーム)
- NoCrash(運転アシスタント)
- RecipeReadr(レシピを読み上げるアプリ)
- Ryde(通勤のために出発する必要がある時間を知らせるアプリ)。
この秋も彼は、テキサス大学オースティン校のコンピューターサイエンス学部生向けのチューリング奨学生プログラムに参加する予定で、引き続き忙しくなりそうだ。

先週、iPhone X用にSmartLensのベータ版をダウンロードし、オフィスで試してみました。観葉植物やティッシュボックス、ボブルヘッド人形、テレビのリモコンなど、あらゆるものにレンズを向けてみました。SmartLensは植物の認識に非常に優れており、同僚のデスクに置いてある植物の種類をすぐに表示してくれたり、別のオフィスにあるヒマワリも認識してくれました。
アプリはフォークともう一人の同僚を「人間」と正しく認識しました。しかし、ラッセル・ウィルソンのボブルヘッド人形を人間と認識したこともありました。これは技術的にはある程度正確です。
Nature Valley のグラノーラバーの箱が製品 ID テストに合格し、iPhone のカメラで生成された画像を上にスワイプすると、Amazon リンクを含む、製品をさらに購入する方法のオプションが表示されました。

SmartLensは確かに高速でしたが、角度や照明によっては、特定の物体に対して正しい「答え」だと認識したものが交互に表示されることもありました。オフィスにある一部の電子機器では、テレビのリモコンを電話だと誤認識したり、Amazon Echoをオイルフィルターだと誤認識したりするなど、少々苦労しました。
「現在、SmartLensは認識した物体に関する有用な情報を90%以上の確率で提供できますが、画像や照明の質、そして認識する物体の種類によって精度は異なります」とロイゼン氏は述べた。「完璧ではありませんが、Google Lens(椅子やピーマンといった基本的な物体を認識できない)よりははるかに優れています。特に、SmartLensは書籍、パッケージ製品、動物、植物の認識に非常に優れています。改善の余地があるのは、特定のテクノロジーデバイスの認識です。ノートパソコンかスマートフォンかは常に認識できますが、ブランドを間違えてしまうことがあります。」

別の同僚が犬を連れて現れた時、アプリがその犬種を判別できるかどうかを試す良い機会となりました。スカウトはミニチュア・オーストラリアン・シェパードですが、SmartLensは彼女をバーニーズ・マウンテン・ドッグと認識しました。
アプリの功績として、Scout は人間からも多くの情報を得ています。
「私の目標は、SmartLensの成功率を可能な限り100%に近づけることです」とロイゼン氏は述べた。「モデルアーキテクチャの新バージョンを設計し、速度と精度をさらに向上させました。将来的には、お客様がアプリに誤りがあれば修正し、同意を得た上で正しい画像をアップロードして、今後のモデルトレーニングに活用できるようになります。」