HadoopTimes

実践 機械学習:レコメンデーションにおけるイノベーション
技術情報

ビッグデータのビッグC:なぜキャラクタリゼーション(特徴付け)がデータに有効(ROIght)なのか

モノポリーは100年前に誕生して以来人気を誇るゲームですが、恐らくその人気の理由は現実世界と並行するというゲームの特色から来ていると思われます。作戦を練ることと、ゲームをプレーするにあたっての多くの行動への決断を集計、そして利益をもたらす駆け引き ― ROIを最大化させることを望みながら。先へと進んで報酬を得ることは非常に重要で、何歩もコマを下げて物品税(もしくはそれより高額な料金)を払うことは避けなければいけません。モノポリーのゲームのもうひとつの特徴として、各家庭によってルールの受け取り方が違い、多くのバリエーションがあるということです:このシチュエーションではどういった行動が正しいのか?このようなコマの動きをしてもよかったのだろうか?

モノポリーのごとく、ビッグデータ時代にいる私たちは同じような”チャレンジ”に出くわします:目の前に現れた巨大なデータサイズ、データ分析への挑戦、可能な利益を前にしたときの感情やショックに打ち勝つ重要なコマの動きとは何なのか?致命的に間違った動作を避け、ビジネスゴールにむけて分析論を使い、コマを動かすにはどうすればいいのか?(注釈:少々の間違いを犯すことは避けて通れないが、それらの間違いはまだやり直しの利く初期の段階で済ませておきたい―これは”フェイルファスト”といい、他の記事で説明します)

ビッグデータを次のレベルへ(たとえば戦略プランニング、ゴールの設定、高い壁の破壊、文化の形成)をするために行なうすべての重要なビジネスの動向の他に、初期の段階で行なわないといけない動きは、情報分析 (”ビッグデータのビッグP” - 例えばデータを熟知するということ)です。その次の分析論の動きで重要なのは、ビッグデータのキャラクタリゼーション(”ビッグデータのビッグC”)です。下記で詳細を説明しますが、まずここではビッグCをビッグデータに関連付けましょう。

以前、新しく提案されたビッグデータの定義:big data is everything, quantified and tracked. について話しました。その文章内では、一般的な例を挙げ、正当化およびビッグデータの解読方法に値する関連ビジネスの動向について話しました。実際、Qの文字下の “Big Data A to ZZ – A Glossary of My Favorite Data Science Things“では、このコンセプトについて紹介しています。その中でQは ”勘定結果と追跡”の意味のビッグデータコンセプトを持ち、ビッグP(データプロファイリング)については、そこにリスティングされていました。ビッグデータの用語解説の中で他に話題に上がっていたのが、C:Characterization(キャラクタリゼーション)でした!このキャラクタリゼーションを:「そこに埋め込まれた格付けの先入観抜きでのクラスタリング、パターン、傾向を探し出すための、任意の管理されていない学習アルゴリズムに利用される、データアイテムの行動と特徴を表現するための記述的パラメータへのメソドロジー」と表現したのです。“Learning from Data, Big and Small, using Characterizations”内で、時系列データ分析に適用されたキャラクタリゼーションについての詳しい例も、そこで述べられています。

ここであなたのビッグデータROI(Return On your big data Investments, and Return On big data Innovation)を上達させるためのビッグCバリューストリームに入る方法をお教えしましょう。特に、ここにはなぜビッグデータのキャラクタリゼーションが正しい(ROIghtな)方法なのか8つの理由が示されています!

キャラクタリゼーションは、次の利益をもたらします
1)あなたのデータ資産の中に発生した行動や出来事、変化などを伝え監視して、追跡するという便利な基準を発生させる(すなわち、“測定され追跡されるビッグデータは、すべてなのだ”という定義を満たす)。
2)ビッグデータの重要な情報内容の小型化・凝縮したバージョンを作ること。
3)データから情報から知識の完了へあなたを近づける重要なデータから情報変換を成功させる、つまりビジネスへのD2Dゴール(発見へのデータ、決定へのデータ、データ・ツー・ドル)を成功させることになるのです。
4)あなたのデータコレクションにおいて、特定の微粒子、物体、出来事や特質に素早い検索、情報収集、再利用を可能にするインデックスとタグを付けることができる。
5)個々のニーズに対応できるよう、そして各データ資産利用者の使用方法に対処できるよう、融通が利く情報中心で事例別に対応可能なインフラストラクチャーの基礎を提供する。
6)ビジネスのプロセスに組み込むことができる(すなわちBPEL = Business Process Execution Languageを使用する)-これは自動で行なうデータ・キャラクタリゼーション、もしくは人的な支援を受けたタグ生成、もしくはどちらも使った方法
7)マルチチャンネルソースとセンサー(ソーシャル、ウェブ、機械データ、取引明細ログ、探知機や他の計測システムを含む)からのデータストリーム上で シグナル, スワン, そしてショックウェーブ の発見を助長し、そしてそれらシグナルをターゲットビジネスバリューと共に実行可能な情報の塊に変換する(finding patterns in the data haystack)。そして、
8)テーラーメイドアプリケーション(キャラクタリゼーション)を提供することで、Hadoop big data processing へのデータテクノロジー投資からのROIを生産的に利用、そして配給すること(The MapR M7 Database Editionなど)― 競争上の優位性とビジネス洞察力へのプロセスノードのクラスター内でマッピング、クランチング、顧客データの削減をする。

結局のところ、データプロファイリング(ビッグP)と特徴づけ(ビッグC)は、ビッグデータ時代の5つのビジネス目標にあなたの会社がたどり着くための動きを援助することによって、ビッグデータポートフォリオからROIを増やすことを可能にしてくれるのです。

(a)ビッグデータ脳へとマインドセットする。
(b)他社と差をつけることを可能にする、会社のビッグデータの戦略的ビッグデータ利用のケースの分析を発展させる。
(c)後におこる混乱を前に自分自身を準備させる。
(e) あなたの会社のどの部署、そしてすべてのレベルにおいて、情報中心のビジネスカルチャーを作成、育成する。人生のモノポリーのゲームのなかでの業績不振をもたらす資産に捕まらないよう、ビッグデータ分析の航海をしましょう。そして、ビッグデータのキャラクタリゼーションでさらに増加したROIへとコマをすすめましょう。正しい行動をしながら、革新案、収入、成長を導くベストな習慣を行なうデータを効果的に利用できるビジネスにしましょう。

こちらの記事もおすすめです