HadoopTimes

ストリーミングアーキテクチャ Apache Kafka とMapR Streams による新しい設計手法
製品情報

M5 Enterprise Editionの機能

Hadoopのアキレス腱でもあった「ネームノード」を無くしたアーキテクチャによりシステムダウンのリスクとパフォーマンスのボトルネックを解消

MapRは、高可用性のために独自のアーキテクチャを持ち、システムの単一障害点または複数の障害から完全に保護する機能を持つ唯一のHadoopディストリビューションです。

JobTrackerの HA化によるジョブ再起動の解消

MapR は、JobTrackerの完全な高可用性機能を備えた唯一のApache Hdoopディストリビューションです。このMapRの独自のサービスによって、すべてのジョブは再起動せずに終了まで確実に稼働します。

スナップショットによる一貫性のあるポイント・イン・タイムリカバリ

MapR は、アトミックで一貫性のあるスナップショットを備えた唯一のApache Hadoopディストリビューションです。MapRのスナップショットは、思い通りの目標復旧時点(RPO)に対応するために柔軟性のあるスケジューリングが可能で、ヒューマンーエラーやアプリケーションエラーからデータを保護します。

効率的なミラーリングによるクラスタ間のデータ同期

MapRのデータ保護機能の1つであるミラーリングの機能によって、目標復旧時間(RTO) を設定し、クラスタ内、クラスタ間 (本番用クラスタと開発用クラスタなど)やサイト間で自動的にデータをミラーリングすることができます。

Direct Access NFS™によりHadoopをNAS同様に利用

MapR Direct Access NFS™ によって、きわめて容易に、また費用をかけずにHadoopを利用することができます。MapRのファイルシステム上ではHDFSとは異なり、ファイルの変更、上書きが可能で、また、どのファイルに対してもNASで行うのと同じように複数の同時読み書きが可能です。

Direct Access NFS™によりリアルタイムのデータフローを実現

MapRでは、NFSでHadoopにアクセス可能で、Apache Hadoopを抜本的にシンプルにしました。例えば、遠隔地のクライアントも簡単にクラスタをマウントすることができます。アプリケーションサーバーはログファイルやその他のデータを直接Hadoopクラスタに書き込むことができるようになります。

Kerberos認証およびネイティブ認証による柔軟性のあるセキュリティ

MapRは、Kerberos に加えて組み込みのネイティブ認証機構を通じたワイヤレベル認証を提供し、Hadoopクラスタのセキュリティを容易に維持できます。

MapR ExpressLaneによる小規模ジョブの迅速な実行

MapR ExpressLaneは小規模なジョブを自動的に識別し、クラスタはそのジョブを長いジョブの終了を待つことなく最短で完了するために必要なリソースを優先して割り当てます。これによりMapRは急に発生した小規模な解析要求に対応するベストのソリューションとなっています。

MapRのボリューム機能による容易なデータ管理

MapRでは、ボリューム機能を利用して関連するファイルとディレクトリを1つのツリー構造にグループ化することによって、クラスタデータへのアクセスや管理が容易になります。ボリューム機能により、ファイルやディレクトリの構造化や管理、セキュリティの維持が簡単になります。

複数のジョブをHadoopクラスタで安全に共有

MapRは、Hadoopで複数のジョブ、ワークロード、ユーザーを安全に共有する環境を提供します。MapRは、アプリケーションがいかなる状態でもコア・クラスタのリソースを間違って使用することがないように保護します。

データ配置の制御によるパフォーマンス、セキュリティ、管理性の改善

MapRでは、データを格納したい場所を特定することができます。また、MapRのデータ配置コントロール機能を使用して、アプリケーションごとにデータの格納位置を使い分けたり、特定のワークロードをクラスタ内の指定のハードウェアで稼働させたりすることもできます。

スケールアップと無制限の数のファイルの作成

ネームノードの無いアーキテクチャによってMapRのスケーラビリティはノード数に比例して拡大させることができます。さらに、実質的に無制限のファイルをサポートします。同じクラスタに単純にノードを追加するだけで、より多くのアプリケーションを展開することができます。