HadoopTimes

実践機械学習
ソリューション

ビッグデータ活用7つの問題点と対策ースタートラインに立つために

IoT(モノのインターネット)、Webマーケティング、都市開発、地域活性化など、現在様々なシーンで“ビッグデータ”が活用されています。膨大かつ高速に蓄積・更新されていくバラエティー豊富なデータ群を上手く活用できれば、事業の有用な知見を見出し、市場競争激しい現代ビジネスを生き抜いていくための大きな武器になるでしょう。

恐らく皆さんの企業でも「ビッグデータを活用して何かできないか?」といった漠然としたニーズを抱えていると思います。ただし見切り発射にご注意ください。ビッグデータ活用には多くのメリットがあるものの、問題点があることを忘れてはいけません。

ビッグデータ活用にはどんな問題点があるのか?何に注意しなければならないのか?今回はビッグデータが持つ7つの問題点を、対策と合わせて紹介していきます。

1. データ消失のリスク

ビッグデータに限らず、データ活用の現場に隣り合わせなリスクが“データ消失”です。特に昨今ではクラウドストレージといったサードパーティにデータを蓄積・保管するケースが多いと思います。自社サーバの設置が必要なく、時間と場所を選ばずシームレスにアクセスできることから多くのメリットがありますが、データ消失のリスクがなくなることはありません。

サイバー攻撃によるサーバ障害、ベンダー破産や災害によるデータ消失など様々な要因が考えられます。また、自社サーバにてデータ管理を行っている場合も消失の可能性は否定できません。消失だけならまだしも、情報流出により大きな損害を被る可能性もあります。ビッグデータ活用で扱うデータ量が膨大になればなるほど、それに比例してデータ消失にリスクが高まるのです。

≪対策≫

クラウドストレージなどサードパーティにデータを保管する際は、第一にベンダーのセキュリティ要件を確認することです。サイバー攻撃対策やサーバ冗長化、定期的なバックアップなど、万が一データ消失が起きても復旧できる体制が整えられているかを確認しましょう。そしてさらに、自社独自にバックアップを取っておくことで確実にデータを守ることができます。

2.プライバシーの侵害

一般企業が取り扱うビッグデータのほとんどが、顧客情報といった個人情報です。このためプライバシー管理には十分気を配らなければなりません。

数年前にはGoogleが提供する「Googleマップ」のストリートビュー撮影車両にて、セキュリティ対策が不十分なWi-Fiネットワークから個人情報を収集するという事例がありました。こちらは英国の事例ですが、データ保護法に違反すると認定され話題になりました。

≪対策≫

今一度、企業のコンプライアンスについて見直しましょう。並びに、個人情報の取り扱いについてしっかりとルールを規定しておく必要があります。また、個人情報の収集や活用については予めユーザーに確認を取る必要があります。

ユーザーに明確な説明をせずに確認を取るようなグレーゾーンでデータ収集をする企業もありますが、後々のトラブルを避けるためにもデータ活用理由などをわかりやすく明示するのがベストです。

3.共通データの活用

「ポンタカード」や「Tポイントカード」など、最近では異なる店舗やサービスで利用できるポイントカードなども増えており、データ収集の幅が広がっています。こういったポイントカードから収集されるユーザーデータは加盟店で共有することができ、一つのビッグデータとして捉えられています。

こうしたデータ収集プラットフォームへ加盟する際は、協会がユーザーへデータ活用目的の明示を行い同意を得ているか、予め確認しておく必要があります。また、FC(フランチャイズ)組織の本部と加盟店で顧客データを共有していたり、拠点間でのデータ共有が問題になる可能性も考慮しなければなりません。

≪対策≫

共通データの活用に関しても、コンプライアンスを見直しデータ活用理由などを顧客にしっかりと明示することが大切です。また、明示するだけでなく同意を得ることを忘れてはいけません。

4.ビッグデータでの人事評価

国内では目立った事例はありませんが、海外ではビッグデータを活用して人事評価を行う企業が増加しています。ログデータや労働時間など、勤務中に発生するデータに関しては問題ないにしても、休憩時間やプライベートまで管理が及んでしまうと監視が勤務外に及び労基法に違反してしまう可能性があります。また、評価制度云々では社員の反感を買う恐れもあるので注意が必要です。

≪対策≫

社員のプライベートを侵害しない範囲でのデータ収集を心掛け、目的の評価制度について社員に明示することが大切です。また、休憩時間は勤務外(プライベートな時間)と労基法で定められているので、侵害しないよう注意しましょう。

5.迅速なデータ処理

ビッグデータはその名が示す通り、ほとんどの場合膨大なデータ群で構成されています。そこで重要になるのが従来よりも高速なデータ処理速度です。どんなにビッグデータが蓄積されていっても、それを処理する速度が追いつかなければデータを有効的に活用することができません。リアルタイムに処理/分析してこそビジネスに有用な知見を見出し、市場競争で競合の一歩先を行くことができます。

≪対策≫

重要なのはビッグデータ処理のプラットフォームとしてどんな製品を採用するか?です。

例えばMapRが提供するMapR Converged Data Platformでは、膨大なデータ処理を数分で完了することができ、また、バッチ系処理だけでなくリアルタイム処理にも対応しています。データの種類によって処理方法を変更することも可能です。

もう一つ、ビッグデータ分析で迅速な処理を実現するためには分析するデータにあたりをつけることが重要です。全てのデータを片っ端から分析しても効率が悪いので、目的に合わせてデータを抽出して分析すると迅速性を高めることができます。

6.第三者による情報の搾取

2016年現在においてもサイバー攻撃による被害は深刻であり、年々手口が巧妙化しています。特にビッグデータ時代と言われ、社内に膨大なデータを蓄積するようになった現代では、その危険性が増加したと言っていいでしょう。

このため第三者による情報搾取に十分注意しなければなりません。また、現代における情報漏洩に約8割が内部犯行・過失によるものだとされています。

つまりビッグデータ活用は外部からの不正侵入や、内部犯行・過失にまで目を向けなければ大きな損失に繋がる可能性があるのです。

≪対策≫

外部対策ではセキュリティシステムの導入など、外部からの侵入を防ぐソリューションを導入して備えるのが効果的です。また、最近では標的型攻撃など巧妙化したサイバー攻撃が横行しています。

こうした攻撃に対処するためにはセキュリティシステムを導入するだけでなく、組織全体でセキュリティ意識を高めていく他ありません。不審なメールは絶対に開封しない、すぐに報告する、業務に関係のないWebサイトを閲覧しないなど、徹底しましょう。

内部対策に関しては各システムのアクセス権限をかけておき、データ取り扱いに関するルールをしっかりと定めておくことが大切です。

7.データ分析者の確保

ビッグデータ分析において絶対的に必要なのがデータ分析者(データサイエンティスト)です。しかし「ただデータが分析できる」だけでなく、「分析したデータをもとに有用な知見を見い出せる」というのがポイントとなります。この点から考えれば、実はデータ分析者として適任なのが“マーケター”です。

もともと顧客を相手にビジネスを行っている人材なので、分析データから売上げ向上に繋がる知見を見出すことに長けています。しかしデータ分析ができるマーケターはそういないので、やはりデータ分析者の確保は大きな問題点となります。

≪対策≫

ビッグデータ分析における分析者確保には3つの選択肢があります。

1つは外部からデータ分析者を確保することであり、最もシンプルですがコストもかかります。

そして2つめは自社でデータ分析者を育成することです。自社ビジネスを深く理解している人材がデータ分析者となるので、事業適合率が高く正確な分析を行うことができるでしょう。ただし、コストと手間がかかるのは避けられません。

最後がデータ分析者プラットフォームを活用し、不特定多数のデータ分析者に依頼をする方法です。例えば「Kaggle(カグル)」というサービスは、データ分析モデルのコンペテンションを行えるサービスであり、「Kaggle」に登録している30万人のデータ分析者に向け自社データを提供することで最適なデータ分析モデルを募集することができます。

たたしサービスによるビッグデータ分析には限界があるので、外部から獲得するか育成するのが得策です。

まとめ

意外にもビッグデータ分析の問題点は多く、これらに対し確実に対策を取っておかなければせっかくのデータも有効活用することができません。特のコンプライアンスの強化や情報流出への対策は十分意識が必要でしょう。

2016年に入り各企業でのビッグデータ活用に注目が集まる中、皆さんの企業ではどのようにしてビッグデータを活用していますか?「まだビッグデータを活用していない」という企業も、数年以内に活用に踏み込む企業が多いかと思います。

そんなときは、今回紹介したビッグデータ分析の問題点を参考に、まずは分析するための基盤を作っていきましょう。対策を取って初めて、スタートラインに立つことができるのです。

ビッグデータ活用に備えるデータ蓄積インフラへの要件

ビッグデータ活用に備えるデータ蓄積インフラへの要件
“ビッグデータ”がIT 関連の最新のキーワードとして注目されるようになって相応の時間が経過したが、現在でもビッグデータにどう対応すればよいか、悩んでいるユーザも少なくないようだ。

ここでは特に、分析を見越してどうデータ蓄積をするべきかのインフラに着目し、ユーザ企業がビッグデータ活用のためにどのような準備を行なうべきかを明らかにしていく。

無料ダウンロードはこちら

こちらの記事もおすすめです