HadoopTimes

ソリューション

ビッグデータ活用で陥りがちな4つの間違い

ビッグデータ」というキーワードが浸透してから既に数年が経過しますが、皆さんの周りでビッグデータ活用によって事業拡大に成功したという話をどれくらい耳にしますか?恐らくそれほど多くはないと思います。むしろ、ビッグデータ活用で成功したという話を聞いたことがないという方も珍しくないでしょう。

ビッグデータはその重要性が叫ばれているにも関わらず、活用しきれている企業は意外と少ないのです。そしてその原因はビッグデータに対するちょっとした認識の間違いだったりします。

今回はそんなビッグデータ活用で陥りがちな4つの間違いについて紹介していきましょう。

データ分析の目的がない

ビッグデータ活用の間違いとして最も多いのが“漠然とデータ分析を行っている”ということです。恐らく分析さえすれば何かが見つかるという認識でいるため、目的のないデータ分析が横行してしまっています。

しかし、正直に言って目的なくデータ分析が成功することはありません。データ分析をもって何を成すか?という目的がなければ膨大なデータ群の中からビジネスに有用な知見を見出すことはできないのです。

また、そもそもビッグデータは“宝の山”ではなく、どちらかと言うと“ガラクタの山”というイメージの方が強いと思います。無数にあるガラクタの中から使えそうな組み合わせを探したり、組み立てることで新たな価値を見出したりするのがビッグデータ活用なのです。

そして“ガラクタの山”の中から使えそうなガラクタを探すためには、ただ漠然と探しているだけでは到底見つかりません。「ここなら使えそうなガラクタが見つかりそうだ」と“アタリ”を付けなければ途方もない作業です。

こうした “アタリ”を付けるためには当然明確な目的が必要なので、ビッグデータ活用はまず何よりもデータ分析の目的を持つことが大切なのです。

そもそもデータが正確じゃない

「データは嘘をつかない」とはよく言いますが、真正面からデータを信じ込むのも非常に危険です。なぜなら、データは時として嘘をつくからです。

例えば、とあるスーパーがイメージ調査のために消費者にアンケートを取ったとします。アンケートには簡単な質問と、世代調査のために性別と年代、そして在住地区についての記入欄があります。しかし果たして消費者は本当のことを記入するでしょうか?そもそも人間は自らの情報開示を嫌うものなので、そこに記入されたことが本当とは限りません。「じゃあそもそもアンケート自体意味がないじゃないか」と思うかもしれませんが、これは極端な例であり大切なのは“データを完全に信じてはいけない”ということです。

特に、自ら苦労して集計したデータほど人は信じ込む傾向にありますが、どんなデータであれ「これは正確なデータか?」と常に疑う気持ちが重要です。そうして正確性を確保したデータを活用してこそ、初めてビッグデータのスタートラインに立ったと言えます。

また、データ分析において思いこみというのも非常に危険です。とある宝くじ売り場を見たときに「この売り場から1等が出ました」という看板を目にしたとします。この時、人間の心理的に「ここで買えば当たりが出やすい」という考えになりがちです。しかし、宝くじとはどこで購入したとしても1枚あたりの当選確率は等しく同じなのです。こうした思い込みにより通常以上に価値を見出してしまうとデータ分析が狂ってしまう可能性もあるので、十分に注意しましょう。

必ずしも“ビッグ”である必要はない

「ビッグデータ」というキーワードのせいもあり、なかなか気付きづらいポイントかもしれませんが、データ分析は必ずしも“ビッグ”である必要はありません。むしろ初めは“スモールデータ”で始める方がデータ分析の本質を掴むことができると考えています。

「獺祭(だっさい)」という銘酒をご存知でしょうか?お酒好きの方ならすぐにピンとくる名前かとは思いますが、実はこの獺祭はデータ分析により作られている銘酒なのです。獺祭を製造する旭酒造は以前、杜氏に逃げられたことから危機的状況に陥ったことがあります。ミリ単位の作業の違いが味に大きな影響を及ぼす酒造は、経験豊富な杜氏があってこそ成り立つものです。その杜氏がいないというのは致命的ですね。

しかし旭酒造はデータ分析によりこの危機を乗り越え、今では以前にも増した高品質を保っています。同社が利用したデータというのは酒造する上での湿度や温度、タイミングなどを細かくデータ化したものです。

これにより入社1年目からでもベテランの杜氏と同程度の品質を保つことができ、効率的に高品質な商品を作ることに成功しています。旭酒造が活用するのはビッグデータではなく、むしろスモールデータと言えるものですが、活用方法により最大限に価値を引き出しているのです。

事例はあくまで事例

ビッグデータ活用で成功した事例が少ないと言っても、インターネットで少し検索すればいくつかの成功事例が出てきます。大企業の事例もあれば、中小企業や地方の温泉施設がビッグデータ活用で成功した事例もあるでしょう。

しかしここで注意していただきたいのが事例はあくまで事例だということ。いくら成功事例だとしても、そのまま自社のデータ分析に活用したとしても上手くはいきません。活用方法は企業によって様々ですので、しっかりと現状課題に向き合ってビッグデータを活用していく必要があるのです。

事例を知ってビッグデータ活用に関するヒントを得ることも大切ですが、あくまで事例だということを意識して参考程度に留めておきましょう。

MapRで築くビッグデータ分析の基盤

ビッグデータ分析においてまず重要なのは高速なデータ処理によるリアルタイムなデータ分析基盤です。日々蓄積されていくデータはその“鮮度”が重要であり、少しの遅れがビジネスチャンスを逃してまう可能性すらあります。

そしてこうした基盤を実現するのがMapRというデータ処理ソリューションです。

MapRはHadoopをベースにボトルネックとなっていた部分を解消しつつ再実装されたソリューションであり、Hdoop以上にデータ分析の迅速性とシステムを可用性を実現しています。

また、MapR独自の機能も搭載していますので、より高速に、より使いやすくを体現したデータ分析ソリューションです。

まとめ

いかがでしょうか?ビッグデータ活用がもてはやされている現代ビジネスですが、成功させることは必ずしも簡単ではありません。今回紹介した間違いを認識した上で自社のビッグデータ活用方法を模索し、かつPDCAサイクルを回して継続的に改善していくことで最適化していく必要があります。

一見華やかに見えるビッグデータ活用も、こうした地道な努力の上で成り立っているものなのです。

今後ビッグデータ活用をしたいという企業はまずデータ分析に必要な基盤をつくり、“ビッグ”でなくてもいいのでデータ分析の本質を掴んでいきましょう。そして、徐々に分析する範囲を拡大していき、ビッグデータからビジネスに有用な知見を見出してくことが大切です。

こうしたビッグデータ分析を実現するためにも、高次元なデータ分析ソリューションの導入は無視できないでしょう。まずは自社にとって最適なビッグデータ分析環境とは?を考えていただきたいと思います。

「いまさら聞けない」データ分析の総ざらい

「いまさら聞けない」データ分析の総ざらい
昨今、「データ分析」の重要性が強く叫ばれています。ただ、それはアナリストやデータ・サイエンティストと呼ばれる“専門家だけが担うことができる難解なもの”という誤解を持たれてはいないでしょうか。

データ分析という手法は、IT のパワーを活用することで、どんな企業も導入・実践することができる“現実解”なのです。

データ分析とはいかなるものなのか――。

この資料では、これからデータ分析を始める方や始めたが、もう一度初歩知識を復習したい方々向けにデータ分析の基本を解説します。

無料ダウンロードはこちら

こちらの記事もおすすめです