Watch

セールスフォースは、アインシュタイン機械学習サービスの基盤となる技術をオープンソース化する計画だ。

セールスフォースは、アインシュタイン機械学習サービスの基盤となる技術をオープンソース化する計画だ。

トム・クレイジット

サンフランシスコのセールスフォース・ウェストビル。(セールスフォースの写真)

セールスフォースは、データサイエンスの問題に悩む他の企業がその取り組みから恩恵を受けられることを期待して、貴重な顧客データを混ぜずに大規模な機械学習技術を使用するために開発した手法をオープンソース化しています。

Salesforceは木曜日、主力製品であるSales Cloudおよび関連サービスの将来を担うEinstein機械学習サービスの主要部分であるTransmogrifAIを、誰でもSaaSアプリケーションで利用できるようにすることを発表する予定だ。Salesforce Einsteinのデータサイエンス担当シニアディレクター、シュバ・ナバー氏によると、TransmogrifAIは、広く利用されているオープンソースプロジェクトApache Sparkをベースに記述された10行未満のコードで構成されており、顧客行動を予測する機械学習モデルのトレーニングに長年取り組んできた成果であり、大量のデータを共通のトレーニング環境に投入することなく実現できるという。

Salesforce Einsteinのデータサイエンス担当シニアディレクター、Shubha Nabar氏(LinkedInの写真)

「データサイエンティストは顧客対応に関わる課題のほとんどに焦点を当てていますが、ビジネスには機械学習がビジネスの運営方法を変革できる他の課題も存在します」とナバー氏は述べた。問題は、データサイエンティストの雇用コストが高いこと、そして開発者の雇用コストは決して安くないにもかかわらず、企業はいずれにせよ彼らを雇う必要があること、そして複雑な制約の中で大規模な機械学習を行う方法を習得することなく、TransmogrifAIのようなソリューションを実装できることだ、と彼女は述べた。

かつて新聞という媒体に掲載されていた人気漫画『カルビンとホッブス』の定番ギャグに、少年とぬいぐるみのトラを思いのままに変身させられる段ボール箱「トランスモグリファイア」が登場します。これは、開発者がデータサイエンティストの関心を惹かないようなアプリケーションを、機械学習の知見によって変革できるようにする、TransmogrifAIの発想の一部です。

「データサイエンティストの数が少なすぎる。彼らは最も重要な問題に取り組んでいる」とナバー氏は語った。

多くの場合、機械学習モデルをトレーニングする際には、パターンを見つけ出すことを期待して、利用可能なすべてのデータを投入します。しかし、Salesforceの顧客はデータセットが混在することに対して非常に神経質になっているとNabar氏は述べ、そのためSalesforceはより限定的なデータセットでモデルをトレーニングする方法を見つける必要があったと付け加えました。

Salesforceのような企業にふさわしく、このプロジェクトは主に、通常は高額なデータサイエンティストが行う作業の多くを自動化することで、企業が販売パイプラインにおける成果を予測できるよう支援することに重点を置いています。顧客が販売プロセスの特定の段階で離脱した理由を解明することで、企業は時間をかけて販売戦略を洗練させることができます。そして、特定の市場において競合他社よりも早くこのことを理解した企業は、競争優位性を獲得し始めることができるのです。

[編集者注:SalesforceはGeekWireの年間スポンサーです。この投稿は、プロジェクトのコードベースの規模を明確にするために更新されました。]