
IBM、新しい「データサイエンス エクスペリエンス」で Apache Spark に注力
ダン・リッチマン著
マイクロソフトが大規模データ処理エンジン Apache Spark への「広範な取り組み」を約束した翌日、IBM は本日、Apache Spark を使用したほぼリアルタイムの分析を行うためのクラウドベースの新しい開発環境である Data Science Experience を発表しました。
IBM はこの環境を、データ サイエンティストが自社のオープン ソース リソースや H2O、Jupyter Notebooks、RStudio のリソースを使用してデータの取り込み、キュレーション、分析を簡素化できるオンラインの場所であると説明しました。
IBMは1年前にSparkへの投資を開始し、3億ドルを投じてSparkを「アナリティクス・オペレーティング・システム」へと進化させてきたと、準備されたリリースで発表した。IBMアナリティクス担当シニアバイスプレジデントのボブ・ピチャーノ氏は、このリリースの中で、Digital Science Experienceは「Apache Sparkのキラーエンタープライズアプリ」だと述べた。
Apache Spark 上に構築されたアプリケーションをすでに使用している IBM の顧客には、iPad デバイス用の仮想ショールームを作成した Bernhardt Furniture、ライダーのパフォーマンスと位置に関するデータを処理する USA Cycling 女子チーム、NASA と協力して 6 テラバイトのデータから知的生命体を示唆するパターンを分析している SETI 研究所などがあります。
「PCの登場により、コンピュータサイエンスは主流となりました」とピチャーノ氏はリリースで述べています。「本日の発表により、お客様は大規模なデータセットへのアクセスと操作をより容易に行えるようになり、大きなハードルが取り除かれます。」