Ipad

Amazonが開発者向けに新しい人工知能サービスを開始:画像認識、テキスト読み上げ、Alexa NLP

Amazonが開発者向けに新しい人工知能サービスを開始:画像認識、テキスト読み上げ、Alexa NLP
awsai-2016-11-30-at-8-51-40-am
AWSの最高責任者アンディ・ジャシー氏が水曜日のre:InventでAIについて講演。写真はAWSライブストリームより。

Amazon は本日、Amazon Web Services 上でアプリを構築する開発者向けに 3 つの新しい人工知能関連ツールキットを発表した。

AWS ライブストリーム経由。
AWS ライブストリーム経由。

アマゾンは、ラスベガスで開催された同社のAWS re:inventカンファレンスで、開発者がAmazon Lex、Amazon Polly、Amazon Rekognitionという3つの新しいサービスを使って、Slack、Facebook Messenger、ZenDeskなどのプラットフォーム向けアプリに人工知能機能を組み込む方法を紹介した。

この構想は、AmazonがAlexaなどの自社プロセスやサービス向けに既に開発している機械学習アルゴリズムとテクノロジーを、開発者が活用できるようにすることです。AWSのお客様は、独自のAIソフトウェアを開発する代わりに、APIコールまたはAWSマネジメントコンソールを使用するだけで、AI機能を自社アプリに組み込むことができます。

AWSのCEO、アンディ・ジャシー氏は、Amazonが20年にわたりAIと機械学習技術の開発に取り組んできたことに触れ、現在では数千人の人材が「当社の事業におけるAI開発に専念している」と述べた。同社は現在、バックエンドのインフラをサードパーティ開発者に開放している。ジャシー氏によると、本日発表された3つのサービスは、来年さらに多くのサービスが登場する予定だという。

Amazonはプレスリリースで、「Amazon AIサービスはフルマネージドサービスであるため、ディープラーニングアルゴリズムの構築や機械学習モデルのトレーニングは不要で、初期投資やインフラ投資も必要ありません」と述べています。「これにより、開発者は周囲の世界を見、聞き、話し、理解し、インタラクションできる全く新しい世代のアプリの定義と構築に集中できるようになります。」

Amazon Pollyは現在、米国東部(バージニア北部)、米国東部(オハイオ)、米国西部(オレゴン)、欧州(ダブリン)の各リージョンで利用可能で、今後数か月以内に他のリージョンにも拡大予定です。Amazon Rekognitionは米国東部(バージニア北部)、米国西部(オレゴン)、欧州(ダブリン)の各リージョンで利用可能で、今後拡大予定です。開発者の方は、Amazon Lexのプレビューに今すぐサインアップできます。

AmazonのCTO、ワーナー・フォーゲルス氏は水曜日に公開したブログ記事で、これらの新サービスについて詳しく説明しました。Amazon Lex、Amazon Polly、Amazon Rekognitionについて簡単に説明します。

アマゾンレックス

awsai-2016-11-30-at-8-57-39-am

Amazon Lex (「A lex a」の間を表す) を使用すると、開発者は音声とテキストを使用してアプリに会話型インターフェースを構築できます。

「Alexaを動かすのと同じ会話エンジンが、あらゆる開発者に利用可能になりました。これにより、洗練された自然言語の『チャットボット』を新規および既存のアプリケーションに簡単に導入できるようになります」とヴォーゲルス氏は記している。「音声認識などのディープラーニング技術を知らなくても、あらゆる開発者がAlexaのパワーを活用できるようになることで、全く新しいカテゴリーの製品やサービスにイノベーションを起こす可能性を秘めています。」

基調講演で講演したジャシー氏は、Lexによって開発者が会話型アプリケーションを構築できるようになると述べました。彼はピザを注文できるアプリを例に挙げ、AWSの人工知能技術、自然言語処理、ナレッジグラフなどがコンテキストとユーザーの意図の理解に役立つと述べました。

「段階的な会話を構築することができます」とジャシー氏は指摘した。

awsai-2016-11-30-at-9-02-37-am
AWS プロダクト戦略担当ゼネラルマネージャーの Matt Wood 博士が Lex について語ります。写真は AWS ライブストリームより。

AWSの製品戦略担当ゼネラルマネージャーであるマット・ウッド博士も基調講演で講演し、Lexを使って会話型旅行プランニングアプリを構築する方法を示しました。そのプロセスは以下のとおりです。

ウッド:ロンドン行きの航空券を予約してください。

AI:いつ旅行に行きたいですか?

ウッド:金曜日の午後。

AI: 午後5時出発のフライトが500ドルです。予約しますか?

ウッド:予約してください。

AI:はい、予約できました。

awsai-2016-11-30-at-9-01-21-am

「これは、Amazon Lex 上で実行されるサービスと実行できるスムーズな会話の非常にシンプルな例です」とウッド氏は語った。

Lex は、Salesforce、Microsoft Dynamics、Hubspot、Twilio、Facebook Messenger などのプラットフォームに統合できます。

Lex の価格情報はここでご覧いただけます。

Amazon Rekognition 

awsai-2016-11-30-at-8-53-52-amAmazon Rekognition は、画像に写っている人物の数、性別、感情、さまざまなアイテムなどを素早く検出できる画像認識サービスです。Amazon が Amazon Prime Photos の画像を分析するために構築したものと同じテクノロジーを使用しています。

「Amazon Rekognition は、画像内のオブジェクト、シーン、概念、顔の検出、2 つの画像間の顔の比較、そして Amazon Rekognition に保存できる数百万もの顔特徴ベクトルの検索機能など、ディープラーニング技術の適用を民主化します」と Vogels 氏は記しています。「Amazon S3 と AWS Lambda に統合された Amazon Rekognition の使いやすい API は、オブジェクトストアにディープラーニングをもたらします。」

写真はWerner Vogelsのウェブログより。
写真はWerner Vogelsのウェブログより。

旅行計画のデモで、ウッド氏はRekognitionをLexと連携させる方法を実演しました。例えば、Rekognitionの画像技術を活用することで、AIは湖や森の写真をユーザーに提示し、旅行先への道案内をすることができます。

「Polly、Lex、Rekognition といった個々のサービスはそれぞれ独立して使うこともできますが、これらを組み合わせることで、まったく新しい、洗練された、カテゴリを定義するようなアプリケーションを構築できるようになります」とウッド氏は語った。

Rekognition の価格情報はここでご覧いただけます。

アマゾンポリー

awsai-2016-11-30-at-8:55-15-am

Polly は、テキスト読み上げディープラーニング サービスです。

「Amazon Pollyでは、Alexaの音声開発に使用したのと同じテキスト読み上げ技術をAWSのお客様に提供しています」とヴォーゲルス氏は述べている。「高品質な音声出力でアプリを強化したいと考えているすべての開発者に、この技術をご利用いただけるようになりました。」

ジャシー氏は、開発者がPollyを使って「ワシントン州の気温は華氏75度です」といったテキストを入力し、MP3ストリームを出力する仕組みを説明しました。Pollyにはインテリジェンスが組み込まれており、「ワシントン州の気温は華氏75度です」といった音声が出力されます。

awsai-2016-11-30-at-8-54-26-am

Pollyには47種類の音声と24言語が搭載されています。Pollyの価格情報はこちらをご覧ください。