HadoopTimes

実践 機械学習:レコメンデーションにおけるイノベーション
技術情報

MapRを選ぶ理由

MapRは、企業のデータセンタでの運用性に焦点をあて、Apache Hadoopのアーキテクチャに革新的なイノベーションを加えた製品です。MapRはエンタープライズアプリケーションに要求される機能や性能を網羅した唯一のディストリビューションです。

MapRは先進的な技術プラットフォームをベースに、Apacheプロジェクトをサポートしています。この技術プラットフォームは高可用性や障害回復、セキュリティ、データ保護などのエンタープライズ向けの機能を提供するだけでなく、読み書き可能なNAS(Network Attached Storage)としてHadoopに容易にアクセスすることを可能にしています。

おもな特長

業務環境でのHadoopの成功

icon1-hadoop-production-successMapRは企業での運用を念頭において設計されました。MapRによってHadoopは、高い性能はもちろんのこと、データロスが許されず24時間365日稼働が求められるようなミッションクリティカルな企業向けビッグデータアプリケーションとして利用が可能になります。MapRはバッチ処理から対話型クエリ、そしてリアルタイムストリーミングまで幅広い分野の Hadoop アプリケーションをサポートしています。

詳細はこちら

アーキテクチャ

architectureplan_0MapRは、先進的なMapRデータプラットフォームのアーキテクチャによりエンタープライズレベルのミッションクリティカルな業務環境を成功に導きます。MapRデータプラットフォームは、Hadoop分散ファイルシステム (HDFS) と100%バイナリ互換であり、ベンダーロックインの危険性もありません。また、読み書きが可能であるだけでなくNFSマウント可能な分散ファイルシステムの機能を提供します。これらはストレージハードウエアに直接アクセス可能なC++で開発されているため圧倒的な性能と管理性を提供します。

アプリケーション毎に複数のクラスタ環境が必要になる他のディストリビューションとは異なり、MapRデータプラットフォームは分散ファイルとデータベーステーブルを1つの統合レイヤで処理するように設計されています。これにより、操作系のアプリケーション (例:HBase) と、解析系のアプリケーション (例:Apache Drill、Hive、Impala) を、1つのクラスタでサポートするとともに、運用コストを削減しつつ、Hadoop 環境を拡張することができるのです。

詳細はこちら

オープンソースへのコミット

icon2-power-of-open-source_1MapRは、企業で利用するための厳しい要件に対応するアーキテクチャを提供しているだけではありません。MapRは、Apache主要プロジェクトを常にテスト、検証し、安定した状態にして、自社のディストリビューションに搭載しています。MapRは通常、90 日以内にリリースされたApache OSSプロジェクトの新バージョンへのアップグレードと、リリース済みのプロジェクトのアップデートを月次で提供しています。また、MapRはコードとライブラリをGitHubリポジトリ、Mavenリポジトリで利用可能にしています。さらに、MapRはApache MahoutやApache Drillなどのプロジェクトへの参加を通じて、オープンソースコミュニティに多くの貢献をしています。

詳細はこちら

ビッグデータアプリケーションのための統合プラットフォーム

icon2-one-platformMapRは、Hadoopを中心としたビッグデータのためのエンタープライズデータハブを提供します。Hadoopは、データの保存や複数ソースからのデータ統合、データベースの運用、解析、検索、リアルタイムストリーム処理などさまざまなワークロードに対応した汎用プラットフォームです。MapRは、ネイティブファイルとテーブルをサポートした最先端の Hadoop ディストリビューションであり、最小の設備と予算で多数のアプリケーションをサポートする動的なワークロード管理を可能にしています。

詳細はこちら

こちらの記事もおすすめです