HadoopTimes

実践 機械学習:レコメンデーションにおけるイノベーション
技術情報

MapRがApache Sparkのフルスタックを統合

500を超えるお客様を抱える私のチームは、ビッグデータから価値ある情報を引き出すために我が社のHadoopをご利用中の多くの組織と対話する機会があります。ここ数か月の間でお客様が最も関心のあるトピックの一つは、Apache Sparkです。このテクノロジーの利点や用途についてただ知りたいというお客様もいらっしゃれば、すでにMapRディストリビューションと共に生産に活用しているお客様もいらっしゃいます。我が社のお客様は、世界最大の電話会社から小売業者、さらには最近DatameerのCEOであるStefan GroschupfとのインタビューにおいてMapRのSparkの活用について語ったQuantifindなどのシリコンバレーの新興企業まで様々です。

本日、Databricksとの旅路の始まりと、Apache Hadoop用のMapRディストリビューションへのSparkのフルスタックの追加とを皆様にお伝えし共有できることを嬉しく思います。今や私達は、SparkやSpark Streaming(ストリーム・プロセシング)、Shark(Spark上のハイブ)、MLLib(マシン・ラーニング)、そしてGraphX(グラフ・プロセシング)などを含むSparkのフルスタックをサポートする唯一のHadoopディストリビューターとなりました。これは、オープン・ソースへの我々の尽力を示すものであり、仕事に用いる正しいツールを選び取るための最大限の適応性をお客様に提供することへの我々の献身を約束するものです。