HadoopTimes

実践 機械学習:レコメンデーションにおけるイノベーション
技術情報

ビジネスリーダーに必要なのは、VではなくRである

ビッグデータにおけるVについては、これまで多くのことが述べられてきました。これらはビッグデータを管理し、処理する上での技術的課題を説明するのに有用ではありますが、ビジネスリーダーのニーズを無視しています。技術者として、私たちはしばしば仕事上のカウンターパートに対してビジネスの利益を提示する必要性を考慮することを忘れてしまっています。このことが、ビジネスに関わる人々がビッグデータが企業にもたらす複雑性と価値を理解し、自分のこととして考えることができるようにという目的で5つのRを作ることにした理由です。

正直に話しましょう。「量」「種類」「速さ」そして「真実性」という言葉はビジネス用語ではなく、この文脈においては「価値」さえもビジネス的には、企業の年次報告書にあがってくるようなもの(たとえばブランド認知や信用)に関連していません。ビジネスに関わる人々はVで始まるこれらの言葉を理解してはいますが、それがどのようにビジネスに関係しているかということは必ずしもわかってはいません。これらのVは技術的な問題であって、ビジネス的な問題ではありません。

技術者として、私たちは、ビジネスリーダーたちが理解することができ、結果としてその促進のために資金を出してもよいと思えるような言葉を使って話さなければなりません。Vはコインの一面で、もうひとつの面がRであると考えるとよいでしょう。
Five-Rs-image
関連性 – (フィットするデータ) すでに存在するデータを使って、新しいデータの曖昧さを無くす、すなわち、ビジネスの成果にとって何が潜在的に重要であり役に立つものであるのかを定義します。

これは信号対雑音比について述べており、あらゆるビジネスで問題になっていることです。私たちはどのようにして何がよりよいビジネス的理解を得るために重要であり、反対に何が私たちを決定的なビジネス的理解から遠ざける要因であるか、ということを区別するのでしょうか?技術的には、量と真実性が問題になってきます。いろいろなツールを使って、雑音を避け、信号により焦点をあてていくことができます。

リアルタイム性 – (正確なデータ) データ作成時から利用するまで、時間にともなう価値を増やしていくこと。

さまざまなビジネスから受ける注文のうち最も多いのは、「データが今すぐ必要なんだ!」ということです。私たちの障害になるVは「量」「速さ」と「種類」です。ソースシステムがデータをはじき出すにしたがって、私たちはそれを処理し、抜粋し、変形させなければなりません。「量」「速さ」と「種類」この3つのVが高ければ高いほど、私たちの顧客に役立つデータを得ることができる潜在能力は高まります。

現実性 – (データのもたらす理解) データ入手、解析学の処理と適切なデータ手法が、ビジネスでの定まった使われ方を裏打ちする。

企業は、業績を左右することになるビジネス的な理解を抽出することができなければなりません。「真実性」と「種類の多さ」は、企業にデータが正確なものであり、重要なビジネス的理解を導き出すために十分に多様化されたソースに基づいているという自信を与えます。

信頼性 – (データの質) データの質は、結果の信用性と有効性を決定付けます。データの質が高いことは、好ましい結果と相関関係があります。

Vの中で直接的に述べられていますが、データの質は主に「真実性」の影響を大きく受けます。しかしながら、私はこの単純な関係性だけでは不十分だと感じています。RはVと一対一の関係をなすように意図されたものではありません。データ処理システムを管理する上で、質は大変重要であり、データが多ければ多いほどよいということではないということを考慮する必要があります。どのくらいの量、速さ、種類を限度とするかは、いつデータを付加するかということと同じくらい重要な検討に値します。

ROI – (財産としてのデータ) データの効率的な管理と分析は、よりよいビジネス上の決定を可能にし、したがってデータ処理システムの投資に対する利益(ROI)を最大化します。

あなたのデータの潜在的「価値」を理解することで、ROIを計算することができます。私の専門的な意見では、ROI 対 価値の比が1以下になっているべきです。もしあなたがご自分のデータ財産の価値を10 ミリオンドルと評価するならば、20ミリオンドルのROIを望むことはできません。もしそのようなROIが出た場合、あなたはご自分の財産を正しく価値評価しなかったということになります。年毎にあなたのROI 対 価値比は少しずつ異なってくるかもしれませんが、企業に対してあなたがその企業のRとVをしっかり理解していると示すことで、ビジネスリーダーたちを味方につけることができるでしょう。

Concurrent Inc のアンバー・E・ワトソンは、ビジネス面について以下のようなすばらしい記述をしました。「組織はさまざまなソースから膨大な量のデータを集める最良の方法を決めなければならないが、課題はそのデータが最も良いROIを得るためにどのように管理され、どのように分析されるかにある。組織の最終的なゴールは、適切なデータを集め、それらを成長のための最善の決定を生み出すために使用することである。」ビジネスを成長させるということは、その合計価値を増やすことであるか、または… はい、そのとおりです。投資に対する利益は、「価値」とビジネスの能力によって最大限まで高めることができます。簡単に言うと、あなたが木材、鉄、食品またはデータのどれをあつかっているかに関わらず、あなたはそれらの価値を高めるためにやっているのです。この意味では、加工された商品は本質的に、原料を加工した時点で高められた価値を持っているということになります。

私はVとRを相互に関係付けて、これらが陰陽の関係においてどんなに密接に織り交ぜられているかということを示そうとしました。完全ではないものの、Rはビッグデータの領域において技術者とビジネスリーダーの両方におこっていることの関連性を明らかにする助けになるはずです。最終的には、私たちは企業を前進させるという、同じゴールを目指しているのです。私たちのビジネスのカウンターパートの理解を高めるような話し方をするというのは、とても良いことです。