HadoopTimes

ストリーミングアーキテクチャ Apache Kafka とMapR Streams による新しい設計手法
技術情報

Apache Drillによる「競争力」という恩恵

御社のビジネスIQを高めましょう―いかにApache Drillが、競争力という利益を目に見える形で提供するのか。

オープンソースでスキーマのないSQLクエリエンジンで、非常に印象深い内容です。しかし、Apache Drillはどのような恩恵を企業にもたらすのでしょうか?

その答えは明快です。企業が、Hadoopに蓄えたデータから最大限の価値を引き出すことを可能にするのです。Apache Drillは、アナリストのデータ処理に制約を与え、集めうるインテリジェンスを制限してきた数多くの技術的な壁を打ち破ることによって、それを実現します。

Apache Drillを使用すれば、データ科学者たちは、現世代のツールの限界から来る制約を受けることがなくなり、ITリソースを失うことなく、さまざまな生産性の高い方法で自由にデータを処理するようになります。

セルフサービスにより優れたデータ分析を実現します

スキーマを管理し、分析用のデータを準備しつつ、ITが完了するまでにETLタスクをセットアップするやり方では、有益な関連性を失っているかもしれません。

Apache Drillは、アナリストに対し、ネイティブなスキーマのないフォーマットのデータ、ネステッドデータ、さらにITの関与がなく急速に進化するスキーマのデータを即座にクエリできるようにします。その恩恵は、アナリストに対して、データがシステムに流れ込んでいる際のデータへのアクセスを提供することだけにとどまりません。探索的なクエリをも可能にします。つまり、アナリストその他のユーザーは、よく知られたANSI SQLセマンティクスを使ってデータを直接、探索できるのです。進化するデータが、クエリのレスポンスのために必要に応じて自動的に付加され、アナリストに対して確実性を与えます。

さらに、アナリストは、情報がストップし、ITが追加データのセット上のスキーマを定義するのを待つ必要がないまま、情報がリードしうるどんな場所でも、情報証跡をフォローできます。興味深いビジネス・インテリジェンスとして形づくられる複雑なクエリを機能させ、結果的に技術的な障害やデータの有用性の壁にぶつかることは、信じ難いほどにフラストレーションを引き起こすものです。Apache Drillは、データが利用できる状態になる前に記述されることを要求しません。ANSI SQLをサポートし、ユーザーが現行のSQLスキルを簡単にてこ入れを行い、Excel、Tableauその他のスタンダードなODBCおよびJDBCのドライバを利用している、お好みのビジネス・インテリジェンス (BI) やアナリティクスのツールを使用できるようにします。

実質的にラーニングカーブはなく、必要なデータにアクセスする際の苛立たせる遅延もありません。Apache Drillは、セルフサービスの分析を最高の形で提供します。

全体像によって、よりよい意思決定を可能にします

Apache Drillは、Hadoopファイルシステムであろうと、NoSQLデータベースであろうと、1分未満のレスポンスでペタバイトのスケールのデータをリターンできます。クエリは、常時更新され、同時にクエリされるゼロ・レイテンシ (evolving) のデータと同様、履歴データに対しても実行することができます。これは、オペレーショナルなインテリジェンスのアナリティクスやリアルタイムの分析といったクリティカルな機能のためのデータを処理する上で、非常に効率的な方法です。

この効率性は、あなたが既知の構造化データに制限されることなく、ERPシステムを越えて、センターログ、スプレッドシート、トランスクリプト、ソーシャルメディアのデータ、クリックストリームのデータ、さらにWebログファイルを呼び出せることを意味します。さらに、(公開されている産業データのような) 外部データをそのミックスに加えることで、先進的で有益な識見を臨機応変に得ることができます。

Hadoopが登場する以前は、そうした莫大な量のデータの蓄積は財務上、実現できませんでした。今では、外部データをHadoop Distributed File System (HDFS) またはMapR-FSに蓄えることが可能になりました。それはHadoop上のNoSQLのエンジン (MapR-DBとHBase) を通した場合にも利用可能になっており、Apache Drillによってリアルタイムでクエリされます。Apache Drillは多くのデータソースをサポートしていますので、クエリは単独のHDFSソースに限りません。あなたは、MongoDBもクエリできますし、ANSI SQLセマンティクスを使って、HadoopすべてのデータとSQLジョインも実行できます。

Apache Drillを使えば、ビックデータからの有益な情報を引き出せる可能性は、データ科学者の想像力によってのみ制限されることになります。

開発ロードマップ=リスクマネジメント

最高の恩恵と特長、そして開発ロードマップは、イニシアチブが果たされるという信頼がなければ意味がありません。Apache Drillの将来については、心配する必要はありません。Apache Software Foundationは2014年12月、DrillをApacheでの最高レベルのプロジェクトに格上げすると発表しました。そこではApache Drillは、Apache Hadoopやhttpd (世界で最も人気のあるWebサーバー) といった他の華々しいプロジェクトとも肩を並べています。
Apache Drillプロジェクトの格上げは、ユーザーや開発者の力強いコミュニティが共有するビジョン、そして彼らが証明したビジョンを成し遂げる能力が認知されたことを示しています。あなたは、なぜApache Drillが、Apache Drillに伴うフリーなMapR Sandboxによって、ユーザーに選ばれるデータ探求ツールになっているのか、理解できることでしょう。MapR Technologiesは、Apache Hadoopのための最高ランクの流通を担うプロバイダーなのです。

こちらの記事もおすすめです