HadoopTimes

ストリーミングアーキテクチャ Apache Kafka とMapR Streams による新しい設計手法
技術情報

ビッグデータが向かう次なる目的地 – 認知解析 –

データ解析の発展は、BIG (ビジネス、産業、政府) 分野でのビッグデータの発展と共に行われてきました。データ解析とビッグデータは今や留まることなく突き進んでおり、最初にデータベースが構築された1960年代と1970年代 (リレーションナルデータベース管理システム (RDBMS)) のはるか先を目指しています。

従来のデータ (およびビジネスインテリジェンス) システム (データベース、スプレッドシート、電子テーブル) からのビジネスアウトプットはレポート (情報等) であり、データレコード (取引履歴等) に捕捉された物の定量的な記述です。これは定量解析を経たデータの抽出であり、それぞれが取り組む事業の事後解釈 (過去のデータから) と監視 (現在のデータから) に利用されています。

現在のビッグデータシステムは、従来のRDBMSよりさらに広く、深く定量的に各々の事業を描写します。ビッグデータシステムは大量のソース (組織の内部と外部)、複数のチャンネル (ソーシャルメディア、ウェブ記録、購入取引、顧客サービスの相互作用) と多様な視点 (前後関係、コンテンツ、感情、場所、時間) からのデータを重ね合わせます。結果的に、それぞれのビジネス分野における対象 (顧客、機械、ビジネス活動) の行動を予測するモデルを作り出すことが可能となります。つまりビッグデータシステムからのビジネスアウトプットは単なるレポート (情報) 以上のものとなるのです。このアウトプットは新しい知識 (それぞれが取り組む事業の過去、現在、そして未来について) となるに違いありません。これは予測解析によるデータから発見され、それぞれの分野の対象に関係して起こりうることについて予見性を与えます。

最近の発展は予測解析の登場であり、対象がどのように行動し、予測モデルも超えること (単に過去のパターンと行動だけをもとにしているため、それまではなかった行動、パターンや結果を予測できないこと) も洞察できるようになりました。この洞察は過去に生じたことに囚われないために必要です。設定した対象 (顧客、機械、ビジネス・プロセス、競合相手等) が取る行動状況を客観的に理解するためでもあります。それは特定の手法であり、従来のデータ処理では見えなかった「新しい手法」です。

予測解析モデル、特定のビジネスの対象を把握するモデルによる洞察力と知識で強化することで、最適な結果を生み出す状況 (マーケティングカンパニー、外部要因、オファー、有益なパラメータの設定、ビジネス上の決定等) を想定することができます。その結果、理論の最適化がデータサイエンスを取り扱うチームにとって、予測解析の成功を達成するために重要で欠かすことのできないスキルとなるのです。そのようなプロジェクトからのビジネスアウトプットは理想的な結果 (収益、売上、ROIとコンバージョン率の最大化、コストやダウンタイムの最小化、顧客の満足等々) となるでしょう。

予測解析に対する関心の高まりは驚くものではなくなっています。今や特に新しい手法というわけでもありません。オペレーションズ・リサーチ (OR) 分野は、長年ビジネス上の問題に対し最適な技法を提供してきました。現在のビッグデータの時代では、ビジネスでORブームが起きています。大量で多様なビッグデータは、予測解析モデルにとって豊富で、深く信頼のできる資源です。解析ツールの力と能力を増大させ、企業全体でその予測解析を有効的にいつでも利用でき、とても活用的なビジネスツールとなるのです。

しかし、まだデータ解析の話は終わりません。本題はこれからです。

データ解析の発展の次なるステージは、認知コンピュータの分野になります。IBMのワトソンはこのコンピュータのプロトタイプです。ワトソンは大量に保存されたデータにアクセスすることができ、学習アルゴリズムを利用して全ての情報資源をめぐり、結合性と関連性を発見することができます。さらに、発見、決定サポート、さらに深層学習のための原動力として「ナレッジベース」を利用します。認知解析は、ある状況で何が正しいか、例えば適切なタイミング、文脈での正しい返答を判断します。ジェパディについて考えてみましょう。ヒントが「1984年」で「ノンフィクション作家」という文脈ならば、返答は「ジョージ・オーウェルですか?」になります。「1984年」で「一番良い映画」なら「アマデウスですか?」になるでしょう。同様に「アメリカ大統領」なら「ロナルド・レーガンですか?」です。

認知解析は、データ駆動型の発見と意思決定にとって最良のパラダイムです。ビッグデータに適用される機械学習アルゴリズムは、過去のトレンド、リアルタイムの行動、予測される結果、最適な返答のためのデータを探し出すでしょう。認知機械 (認知解析アルゴリズムによる) は適切な設定のもと業務を自動化 (人の介在をなくす) します。もちろん、意思決定を全て機械に任せるわけではなく、新しく、すばらしい、それまでになく、重要で影響力のある発見のため自動収集した大量のデータを探りだすことに利用することが妥当です。

地球から遠く離れた宇宙探索、サプライチェーンの監視やオーダー処理、一般事務作業、大規模データセンター業務などで作業の自動化に用いることができます。さらにスマートデバイス、スマートメーターシステムやスマートデータ (例えば自己認識データ。そのメタデータタグは、データがビッグデータシステムに取り込まれた時点で自動認知学習アルゴリズムにより自己生成される) などで特に利用されるでしょう。

認知解析には限界がありません。ビッグデータ解析の鉄道は超スピードで走り続け、最初にデータベースとビジネスインテリジェンスが世に登場した頃には想像もできなかった場所 (発見、意思決定管理や深層学習) へと連れて行ってくれます。認知解析の向こうには何があるのでしょうか。ビッグデータ市場におけるMapRの強みについての最新の報告は、データに対する解析のさらなる適用を想像させるものになっています。認知解析は必要であり、MapRの限界に挑戦することで、その疑問の答えを見つけることができるのでしょう。

こちらの記事もおすすめです