HadoopTimes

実践 機械学習:レコメンデーションにおけるイノベーション
ソリューション

ビッグインテリジェンス: BIとビッグデータを結び付けるApache Drill

データ探索のまったく新しい世界が出現しました。ここはSQLスペシャリストが新しいデータセットにアクセスできるようなるまで何週間も何ヶ月も待たされることがないSQLスペシャリストが尊重される世界です。BIユーザーのためにスキーマを準備したり保守したりする際にIT部門がボトルネックになることのない世界です。情報の手掛かりが導くままにデータサイエンティストが情報を自由に探索できる世界です。

旧来の分析方法は固定的です。データセットが事前に定義されており、スキーマも固定されています。分析で何か興味深いものが発見されたとき、さらにデータを深掘りするには、ゼロから始めなければなりません。その場合もIT部門がモデルやスキーマのセットを準備し、更新するまで待たなければなりません。

そうしたことすべては、ビジネスアナリストやデータサイエンティストが、実行に直結した洞察に変化する可能性のある変則的な小さい連関やニッチグループの効果的な絞り込みにつながるかもしれない不可思議な例外を発見する能力を制限する要因になります。問題は、データ分析があらかじめ定義された境界に制約されていると、インテリジェンスを収集するするペースが遅くなり、競争相手に後れを取ることです。

ビッグデータの潜在力を最大限に活用するDrill

Apache Drillはビジネスアナリストやデータサイエンティストをこのような制約から解放します。オープンソースコミュニティはグーグルのDremelの当初の機能を大幅に改良し、アーキテクチャーの拡張性、全体のアジリティ、ANSI SQLのサポート、オプションのスキーマの処理、および最新のデータ構造やネストされたデータ (JSONやParquetなど) の効率的な処理能力を含む機能強化を図りました。

Apache Drillを利用すれば、データアナリストは、IT部門にスキーマの定義や新しいETLプロセスの作成を依頼しなくてもデータを探索することができます。アナリストのデータ分析が進行するにつれて、Apache Drillのエンジンはソーススキーマを発見し、自動的にクエリプランを調整します。分析を行いながら自己記述データをクエリし、複雑なデータ型を処理できるため、ビッグデータからあらゆる有用なビジネスインテリジェンスを生み出すまったく新しい手法が実現します。ANSI SQLのセマンティクスを利用してHadoopHBase、およびMongoDBなどのデータソースをクエリし、思考と同じ速度で新しい洞察を得ることができます。

実行に直結した洞察は、ブログの投稿、センサー、クリックストリーム、顧客とのやり取りの記録、動画、トランザクションデータ、競合分析、その他さまざまな一見すると無関係な複数のデータソースの間に相関関係を発見することから生まれます。Apache Drillでは、エンドユーザーが、ほかのいずれのHadoop用SQLエンジンよりずっと迅速にそのようなデータセットに対してSQLクエリを簡単に実行することができます。ビッグデータから価値を引き出すのにかかる時間が短いほど、企業がより多くの顧客と接触し、顧客のニーズに応えられる可能性が高くなります。

履歴情報、ニアタイム情報、リアルタイム情報の適切なミックスが最高の洞察を生み出すことは多く、そのおかげで企業は、とりわけ顧客のニーズを予測したり、消費者のプリターゲティングを行ったり、予算支出を設定したり、大問題になる前にサプライチェーンの問題を発見したり、従来に比べてはるかに効率よくリスクを管理したりすることができます。Hadoopは1箇所に大量のデータを保存するための適切なプラットフォームを備えていますが、Apache Drillは使い慣れたBIツールをフロントエンドとして利用して、そこに保存されたデータを簡単かつ迅速にマイニングするための適切なSQL機能セットを備えています。

データをドリルするためのトップレベルのソリューション

ビッグデータは、あらゆる業界および政府機関で急速にミッションクリティカルな存在になりつつあります。そして、ビッグデータへの依存度が高まるほど、当然、ビッグデータの探索に使用されるソリューションに対して高い信頼性が求められるようになります。せっかくツールの使用方法の学習に時間を費やしたのに、そのツールが廃れたり、放置されたり、ツールの開発が中途半端になったりすることはだれも望んでいません。

Apache Drillはビッグデータに対するSQL分析の主要なテクノロジーとしての地位を固めています。Apache Software Foundationは、2014年12月、DrillをApache Hadoopやhttpd (世界で一番普及しているウェブサーバー) など、その他の優れたプロジェクトと同列のApacheのトップレベルプロジェクトに昇格させたことを発表しました。Drillがトップレベルプロジェクトに昇格したことは、Drillのユーザーや開発者のコミュニティの持つ力が認められたことを意味しています。

Apache Drillを利用すれば、ビジネスアナリストやデータサイエンティストは、自社のビッグデータが自分たちに伝えようとしていることを発見できます。Sandbox with Apache Drillで開発者に問い合わせて、いますぐApache Drillの機能をご確認ください。

おてがる分析パック:ビッグデータ・IoT時代のBI & BAの決定版

おてがる分析パック:ビッグデータ・IoT時代のBI & BAの決定版
ハードウェア、DWH、ETL、BI、データマイニングの全ての機能とCTCのインストール、教育サービスが含まれたオールインワン・パッケージです。

IoT / ビッグデータ時代に求められる大量データの分析と活用ソリューションです。

分析時代の新基盤Hadoopを使うことで、RDBMS(DWH)よりコストもデータも効率良く活用でき、データドリブン企業の武器となりビジネスに大きく貢献します。

無料ダウンロードはこちら

こちらの記事もおすすめです