
スタートアップを百度に売却した後、ベテラン技術者がコールセンター向けAIツールを開発する会社を設立
ネイト・ベック著

重要なポイント
- Seasalt は、企業のコール センター向けにカスタマイズ可能な音声認識技術を構築しています。
- 創業者らは2017年に最後のスタートアップ企業を百度に売却した。
- 同社はクラウド通信大手のTwilioと提携している。
2人のベテラン技術者が、最後のスタートアップ企業を百度に売却した後、Seasalt.AIという会社を設立し、競争の激しい音声認識分野に再び参入した。
このスタートアップは、コンタクトセンターを持つ大企業向けにソフトウェアプラットフォームを販売しており、当初は東南アジア市場に重点を置いています。開発者はSeasaltを使用して、ユーザーと会話形式でコミュニケーションをとるアプリ、デバイス、サービスを構築できます。
同社は、音声認識ソフトウェア分野の専門家である陳国国(Guoguo Chen)氏と姚旭晨(Yao Xuchen)氏によって設立されました。陳氏はAndroid向けホットワード「OK Google」を開発し、Kaldiと呼ばれる音声認識プロジェクトの共同著者でもあります。Kaldiは最終的にNVIDIAのグラフィックカードに統合されました。一方、姚氏はジョンズ・ホプキンス大学で博士号を取得し、以前はシアトルのアレンAI研究所(AI2)インキュベーターで勤務していました。
2015年、チェン氏とヤオ氏はAI2からスピンアウトしたスタートアップ企業KITT.AIを共同設立しました。同社の人気製品の一つは、カスタマイズ可能なウェイクワードエンジン「Snowboy」です。これは、開発者が独自のハードウェアに音声によるホットワードを追加できるソフトウェアツールキットです。また、開発者がチャットボットを構築するためのフレームワーク「ChatFlow」もリリースしました。
百度は2017年にKITT.AIを買収した。陳氏と姚氏はこの中国のテクノロジー大手で2年間勤務し、2019年に退職した。
従業員22名のSeasaltは、カスタマイズ可能な音声認識エンジンを提供しています。同社は自社の技術を「次世代」の会話型AIと位置付けています。創業者はSeasaltに100万ドル近くの自己資金を投じており、Seasaltは2020年1月の設立当初、シアトルのベンチャーキャピタルUnlock Venture Partnersからも資金を調達しています。
同社は、以下に示す「SeaSuite」と呼ばれる一連のサービスの一部として連携して動作する 6 つのアプリケーションを販売しています。
- SeaChat を使用すると、ユーザーは自動化されたチャットボット応答のフレームワークを作成できます。
- SeaCodeは、会話型AI向けのソフトウェア開発スタジオです。ユーザーはこのプラットフォームを利用して、チャットボットなどのツールを構築できます。
- SeaVoiceは、音声をテキストに変換する(STT)トランスクリプション機能で、様々な言語やニュアンスのある発話を理解できるようにカスタマイズできます。また、このツールにはテキスト読み上げ(TTS)機能も搭載されており、トム・ハンクスやデイビッド・アッテンボローのような音声にカスタマイズできます。
- SeaMeetの秘書のような機能は、会議やミーティングで活用できます。室内で最大12人の発言者を識別できます。ユーザーはモデルをトレーニングすることで、議事録やフォローアップメモなどの自動作成機能も利用できます。
- SeaWordは、テキストから意味のある情報を抽出できるようにカスタマイズできます。また、個人を特定できる情報などの単語を強調表示したり、編集したりすることもできます。
- SeaXはコンタクトセンター向けに設計されたツールです。受信メッセージ、通話、ソーシャルメディアなどへの応答を自動化できます。また、コールセンターのエージェントが顧客からの着信通話を文字起こしして分類するためのツールも搭載されています。
Seasaltは、音声とテキストの両方のニュアンスを理解できるツールを提供することを目指しています。主な用途は、企業のコンタクトセンターです。これらの企業は、このソフトウェアを使用して、エージェントの監視と評価を行うだけでなく、音声データを集約して洞察を抽出することにも取り組んでいます。
グローバル企業は数百カ国にコールセンターを運営する必要があるため、事業を展開するあらゆる場所で、リソースの少ない言語やアクセントに遭遇することは避けられません。例えばアメリカには、少なくとも24の英語方言があります。
Seasalt の顧客には、Cathay United Bank、McDonald's Taiwan、Oppo などの大企業が含まれます。
「どんな企業でも、本当に変なスペルや専門用語があっても、私たちが対応できます」とヤオ氏はGeekWireに語った。
同社は、プロフェッショナルサービスと定期サブスクリプションの両方から収益を得ています。「企業のコンタクトセンターは通常非常に複雑なため、これは純粋なSaaSモデルではありません」とヤオ氏は指摘しました。
シアトルはNLPに特化したスタートアップ企業の温床となっており、その多くはNLP研究に特化したAI2からスピンアウトしています。シアトル地域でNLP技術を開発している企業には、Xembly、Read、Unwrap、Augmentなどがあります。シアトルのスタートアップ企業で、コールセンター向けに音声認識技術を販売していたSpoken Communicationは、2018年にAvayaに買収されました。
ヤオ氏は、パンデミックの影響で、北アジアと東南アジアで多くの越境ECサイトが立ち上がり、海外で商品を販売していると述べた。これはシーソルトにとって追い風となっているという。また、この地域は現在、競合他社によるサービスが不足していると付け加えた。
コールセンターテクノロジー市場には、多くの既存プレーヤーが存在します。テクノロジー大手のGoogleは、自然言語処理機能を「コンタクトセンター人工知能(Contact Center Artificial Intelligence)」というパッケージソリューションで販売しています。AmazonとMicrosoftも、AWS Contact Center IntelligenceとAzure Cognitive Servicesという独自のサービスを提供しています。その他の注目すべきプレーヤーとしては、Deepgram、Five9、Avaya、8×8などが挙げられます。
ヤオ氏は、シーソルトがTwilioとの提携によって販売網が強化されなければ、Five9などの上場企業と競争する「力」はなかっただろうと述べた。KITT.AIから得た教訓は、ソフトウェア自体がスタートアップの強みとなるわけではないということだとヤオ氏は説明した。むしろ、既存の流通、商業化、そして顧客基盤こそが強みとなるのだ、と付け加えた。
編集者注: 投資家と顧客に関する追加情報がこの記事に追加されました。