HadoopTimes

ストリーミングアーキテクチャ Apache Kafka とMapR Streams による新しい設計手法
最新動向

機械学習にはどのような種類があるのか

近年AI(人工知能)の研究にて目覚ましい成果が次々とあがっています。昨年にはGoogle傘下のAI研究企業Deep Mindが開発した囲碁AIの「Alpha GO」が、世界最強の棋士を下しています。この他AIはたくさんの業界で研究が進み、日々製品化されています。

このAIを理解するためのキーワードとして「機械学習」という言葉がよく出てきます。そこで今回は機械学習とその種類についてご紹介します。

機械学習とは?

機械学習はAI研究分野の一つです。私たち人間は特定の情報からパターンなどを見つけ出し、その情報から物事を瞬時に判断することができます。

たとえば猫の写真を見てそれが「猫だ」と判断することに対して、何か特別意識していることはありません。このような判断をどう行っているかは、感覚的な話しで言えば「それが猫だから」としか言いようがないかと思います。しかし実際は、猫の写真を見て「耳がある」「鋭い目がある」「ネコ科特有のフォルム」など大量の情報を脳で処理することで、それが猫だと判断します。

こうした判断は意識することなく行っているものです。人間には当たり前のこの行為もコンピューターにとっては簡単ではありません。なぜなら、コンピューターが物事を判断するためには、何でも数値化しなければならないためです。

たとえばコンピューターが猫の写真を見てそれが「猫だ」と判断できるようにするためには、「猫の体長は○○cm~○○cm」「尻尾の長さは○○cm~○○cm」など数値として定義してあげないといけません。

しかし、個体によって体長や尻尾の長さは違いますし平均的な数値だけでは猫と定義するのは不可能です。体長などの情報だけ定義しても別の動物も猫として認識してしまいますし、かといって細かすぎる定義はそこから外れる個体を猫と認識しません。

何やら複雑な話しですが、コンピューターが物事を独自に判断するというのはそれほど難しいことなのです。

機械学習とはつまり、こうした人間が自然と行っている行為をコンピューターで実現するための研究です。そのために大量の情報を取り込み、反復的に学習をして次第に物事を正確に判断できるようにしていきます。

機械学習の種類

機械学習はコンピューターの学習方法によって大きく3つのカテゴリに分類されています。それが「教師あり学習」「教師なし学習」「強化学習」です。

教師あり学習

教師あり学習はコンピューターに与えるデータにあらかじめ答え(タグ)を付けることで、新しいデータの分類制度を高めるものです。先ほどの猫の例で考えると、大量の猫の写真にそれぞれ「これは猫だ」というタグを付けます。そうした大量の情報を読み込ませることで、次第に猫の写真を見て「猫だ」と判断できるようになります。

この学習方法は主に過去のデータから将来を予測することに使われています。天気予報や迷惑メールの判別などが一般的な活用例です。

教師なし学習

教師なし学習は、教師あり学習と違ってコンピューターに与えるデータにタグを付けません。コンピューター自らデータの特徴を見つけださせて、その規則性を学ぶというものです。そのため教師なし学習には正解と不正解が無いというのが特徴です。

ある一定の基準をデータに与えて、データの分布状況によって新しいデータがどのグループに分類されるかを決定します。その基準については人間が定義する必要があり、その定義によって導き出される答えが違うので、扱いが難しい学習方法です。

強化学習

強化学習は教師あり学習と少し似ています。大きな違いは、強化学習では答えを与えないことです。その代わりコンピューターに「行動」と「報酬」を与えます。

たとえば囲碁AIを開発するにあたって、一手ごとに無数の選択肢がある中で最良を選ぶためには、どの選択肢を選ぶことが最も勝利に近いかを判断することが大切です。そこである行動を選択したことで生じた結果にスコアを付けて、最も報酬に近いものを記憶していきます。

そうすることで同じような状況にあるときに、最も効率の良い行動が取れるようになります。

強化学習は最近「ディープラーニング」として注目されています。このように機械学習にはいくつか種類があり、その特徴によって活用先が違うということです。

機械学習はなぜ重要なのか?

機械学習やAIといったキーワードを見聞きすることが多くなり、研究が活発に行われていることは多くの人が知るところです。ただし、機械学習やAIがなぜここまで重要性されているのか?と疑問に思っている方も多いのではないでしょうか。ここではその理由についてご紹介します。

1. 世界のデータ量は人手では処理できないほど増大しているから

1つめの理由は増大し続けるデータ量に関係しています。2016年時点の世界のデータ量は4.4ZBと言われていますが、その4年後にあたる2020年にはデータ量が44ZBまで増大していると言われています。企業においてもその傾向は同じであり、皆さんは日々増大するデータ量を目の当たりにしているのではないでしょうか。

こうした膨大な量のデータは分析することで様々な知見や洞察を得ることができ、ビジネスに活用できます。しかし、大量のデータを人手で分析することはもはや不可能です。

そこで機械学習を用いて大量のデータを素早く分析するためのソリューションによって、データ活用度を向上します。

2. 機械学習を取り入れないと生き残れない時代だから

企業にとって機械学習を取り入れてデータ分析を迅速化したり、業務効率化を成功することは変化と競争が激しいビジネス環境で生き残るために欠かせないことです。なぜなら、すでに一部の企業は他社との差別化を図るために積極的に機械学習を業務に取り入れており、今後差は開くばかりになるでしょう。

事業の規模にかかわらず、競合他社もそれに応じて機械学習を取り入れないと生き残れない状況になるため、産業全体で機械学習を取り入れることが当たり前になります。競合他社に負けないためにも機械学習を取り入れて業務改革などを実現する必要があるのです。

以上の理由から、機械学習の重要性は年々増加傾向にあります。

中小企業でも機械学習は取り入れられる?

機械学習によって実現できることは色々とあります。たとえばネットショッピングのレコメンド精度を高めて購入率を上昇させたり、人間では不可能なレベルでのデータ分析を実行することで経営意思決定を迅速化させたり、その取り組みは様々です。

こうした機械学習を取り入れたビジネスはもちろん中小企業でも可能です。なぜなら、現在では機械学習を搭載したITツールが数多く登場しており、これを利用することでビジネスの新しい知見や洞察を得たり、業務効率化など直接的な業務改善が実現するからです。

ただしITツールによって人工知能の精度は異なりますし、どのようなサービスを提供しているかも違います。活用する側はその点をしっかりと見極めた上で、自社の経営課題を解決するような人工知能搭載ITツールを選ぶことが大切です。

そうしたITツールの他にも、企業独自に機械学習を取り入れたり、ビッグデータを分析するためのITツールもありますので、より広い視野で自社にとって最適なものを見つけることや将来性なども考慮することがより重要になるでしょう。

実践 機械学習 – レコメンデーションにおけるイノベーション –

実践 機械学習 – レコメンデーションにおけるイノベーション –
機械学習とレコメンデーションにおける、もっとも洗練され、効率的なアプローチの1つに至る鍵は、「仔馬が欲しい」という状況の観察の中にあります。

どれを選べばいいのかめまいがするほどの数多くのアルゴリズムがあり、それらの中から選択をするためだけでも、選択肢を理解し、合理的な判断を行うのに必要な、高度な数学の背景知識を十分に持っていることが前提になります。

こちらの資料は、機械学習とレコメンデーションについて学習したいけれど、どこから始めればよいか迷っているという方におすすめです。

無料ダウンロードはこちら