HadoopTimes

ストリーミングアーキテクチャ Apache Kafka とMapR Streams による新しい設計手法
技術情報

コンバージドデータプラットフォーム:ビッグデータで成功するための方法

アジアのイノベーションは熱くスピードが速い。新しい技術傾向により、組織の内・外部とのやり取り方法は常に変化しており、ビジネス競争に影響を与えている。ビッグデータを分析や料理することで、ビジネス側はデータの価値を理解、競争力を産むにあたり分析の重要性を実現、新しいビジネス機会を生み、現在や未来の顧客ニーズを活用、そして内部業務を最適化ができるようになっている。

しかし、多くの企業がデータ戦略の必要性を認識しているものの、ビッグデータに求められる要件に対応できる適切なプラットフォームを見つけられずにいたり、このデータをきちんと実用できずにいる。

データ量や種類は増加しているため、有意義かつ意味あるビッグデータおよび分析の戦略を持つには、この成長ペースについていくことが極めて重要である。ウェブアプリケーション、ソーシャルメディア、センサーおよびマシンログなどのデータソースに加え、モノのインターネット(IoT)から台頭している新しいアプリケーションにより、この状況は一層複雑化している。IoTの影響は、既に幅広い業界(小売りや金融サービスから電話会社や医療まで)に現れており、繋がるデバイスの成長は管理すべきデータの複雑性を一層押し上げている。

また、上述した多様なデータソースは地理的に分散されていることが多いという事実も検討しなければならない問題だ。組織は、遅延の少ない最寄りのデータセンターにデータを送るため、そのデータにエンタープライズアプリケーションや分析を使用した場合、遅れが発生する可能性がある。さらに、データは常にこうした新しいソースから生成されているにも関わらず、現在の一般的なデータ管理方法は、既定の頻度でデータを処理するように設定されている。データをリアルタイムで保存、更新、分析および料理するプラットフォームを実装することで、組織はビッグデータの力を最大限に活用できるようになるだ。最後に、多くの組織は、データ移動システムやデータ処理システムを別々のクラスタでデプロイすることで、既存のシステムを拡張しようとするかもしれない。

こうした懸念を認識している組織は、私がビッグデータ業界に革命を起こすと予想している、「コンバージドデータプラットフォーム」に依存し始めている。コンバージドデータプラットフォームが、以下のような形で、ビッグデータ関係の意思決定者やデータ分析ユーザーにとって重要なトリガーとなるであろう。

  • ファイル、データベーステーブル、データストリームを統合することで、構造上の複雑性を軽減。
    コンバージドデータプラットフォームによってデータ移動の必要性がなくなり、バッチやストリーミングの分析を一か所にまとめることができる。
  • 継続的なリアルタイムのデータ処理を可能にし、処理や分析の遅延を回避。
    コンバージドデータプラットフォームにより、あらゆる業界の組織が継続的に移動中のデータと保存データを継続的に収集、分析および料理できるようになる。
  • データの多様性や地理的分散の問題に対応。
    コンバージドデータプラットフォームならば、地理的に複数の場所で生成されたデータをリアルタイムで処理でき、組織は完全かつ継続的な事業状況を確認し、重要な事態に対する反応性を改善できるようになる。

将来的に組織が扱うことになるビッグデータの量や複雑性は増しているため、コンバージドデータプラットフォームを取り入れることがより良い結果を達成するための道のりとなる。益々スピードアップする技術環境で競争力を保ちたいのであれば、コンバージドデータプラットフォームモデルを活用し、内部業務を継続的に最適化することがデータ戦略での重要な部分となるであろう。

IoTの影響は、既に幅広い業界(小売りや金融サービスから電話会社や医療まで)に現れているのだ。

著者情報

MapR Technologiesアジアパシフィック/日本 副社長 マーティン・ダーリング

カリフォルニア州サンノゼに本社を構えるMapR Technologiesが、HadoopおよびSparkの機能と革新的データアプリケーションの開発と実行のためのグローバルイベントストリーミング、リアルタイムデータ機能およびエンタープライズストレージを融合させたMapRコンバージドデータプラットフォームを提供している。

ベンチマーク結果:SAS Visual Analytics on MapR Converged Data Platform

ベンチマーク結果:SAS Visual Analytics on MapR Converged Data Platform
この資料では、SASVisualAnalytics( 以下SASVAと略す)のインフラとなるMapR Converged Data Platform における環境構築および性能評価について評価・考察します。

評価・考察の目的

  • インストール検証においては、OS、MapR、SAS のインストール作業手順の確立、およびインストール時の設定値を洗い出しインストールの標準設定/個別設定を明確にし安定したインストールを支援する事を目的とします。

  • 機能検証においてはHadoop 機能にフォーカスしてSASVA のデータロード機能がMapR
    と連携して製品が所定の機能を提供できる状態であることを確認します。

  • MapR Hadoop ディストリビューションを採用することで、Apache Hadoop と比較し、
    システムの性能向上、システムの安定稼働、システム管理の用意性が実現出来ることを
    確認します。

  • 本検証報告は、製品導入における判定・補足資料として使用されることを希望します。


是非ご覧ください。

無料ダウンロードはこちら

こちらの記事もおすすめです