HadoopTimes

ストリーミングアーキテクチャ Apache Kafka とMapR Streams による新しい設計手法
技術情報

人工知能と機械学習:その意味と重要性

編集者注:本投稿は、MapRアカデミーコース、BUS 人工知能と機械学習の概論(Introduction to Artificial Intelligence and Machine Learning)に基づいています。

本記事では、人工知能と機械学習について基本的な背景をご紹介します。

データサイエンスにおけるAIとMLの位置付けは?

最初に人工知能と機械学習の違いを定義し、それぞれの意味を紹介する前にデータサイエンスというより大きな枠組みの中での両者の位置付けを確認することにしましょう。

データサイエンスは近年急激に変化し成長を遂げている分野であり、その動向や乱立する業界用語に混乱してしまいがちです。本ブログではそれらをどう定義するのかをまずは共通認識として明確にします。

ロシアの入れ子人形(マトリョーシカ)をご存知でしょうか?人形の中には、また人形が、そしてその中にもまた人形があるというロシアの特産品です。ただし今は下の絵のように未来的なロボット人形に置き換えて想像してみてください。

今回の例えでは、複数のロボット人形が、各レベル内に入れ子になっていると考えることができます。

これらのロボット入れ子人形、バージョン2.0では、一番大きい人形がデータサイエンス分野全体を示しています。2番目の人形は人工知能を、3番目の人形は機械学習を示しています。ディープラーニングを示す4番目の人形を機械学習の人形内にネスト化することもできますが、今回はあまり触れないことにします。データサイエンス、人工知能、機械学習はこのような入れ子関係であるということなのです。

データサイエンスとは?

人工知能と機械学習は両者とも、データから洞察を得ることを目的とするデータサイエンスという大きな人形の下に位置付けられます。データサイエンスは、大量のデータを分析し、企業に競争力を与えて価値を提供します。

例えば、小売業では購買者の行動を分析し、より顧客に合った提案や販売促進を提供します

昨今の企業が抱えるデータ量は増大の一途を辿っており、このようなビッグデータからビジネス上の意思決定を迅速に行えるように効果的なデータサイエンス戦略が重要となっています。

昨今では、より大きな規模のビッグデータから価値を引き出せるような高度な方法が求められており、このデータサイエンス技術の重要性は増すばかりです。

これらの目標を達成するために人工知能を活用するという動向も必然的な流れと言えるのでしょう。

人工知能とは?

人工知能とは、人間の知的な行動や考えを模倣し実行できるコンピューターのことです。

この人口知能の分野では問題解決や意思決定、認識力、翻訳能力などを含みます。

先ほどの例で機械学習が人工知能の中に入っていることをご紹介しました。つまり、すべての機械学習がAIと見なされることになります。しかし、すべてのAIが機械学習という訳ではありません。

AIに含まれる機械学習以外のロボット人形には、シンボリックAI(Symbolic Artificial Intelligence)を使用したエキスパートシステムやAIプランニングがあります。

シンボリックAI

シンボリックAIは、AIに対する初のアプローチの1つです。人間の知能は記号を操作することで実現できるという主張に基づくものです。これが、物理記号システム(Physical Symbol System)、別名フォーマルシステム(Formal System)の基盤であり、人間の思考能力を追い求めた3つの基本概念を中心としています。

  • 記号(symbol)、例えば物理的に結合し直角に交わる2つの直線である正符号が、まず初めに脳内でエンコードされます。
  • 思考は構造(structure)で、例えば正符号は足すことを意味します。
  • そして操作(manipulation)のプロセスは考えるという行為、つまり記号と構造を合わせることで、例えば1足す2は3の数学的方程式(1+2=3)で正符号が使われます。

この概念をさらにしっかりと理解するため、具体例をいくつかご紹介しましょう。物理記号システムの例として、代数や形式論理の他、チェスも一例としてあげられます。

物理記号の事例:代数

代数では、数字や正符号(+)、乗算記号(×)、等号(=)といった数学演算子が記号です。方程式や公式が式(expression)で、計算が操作された式の結果です。

物理記号の事例:形式論理

形式論理の問題では、「もし(IF)」「あるいは(OR)」「~ではない(NOT)」といった単語が記号です。構造は「真(TRUE)」文または「偽(FALSE)」文、プロセスの操作は論理的推論のルールであり、その結果となるのが最終的な式です。

つまり、「もし健康な成人が発熱したら、インフルエンザにかかっているかもしれない」と言えるわけです。

物理記号の事例:チェス

そしてチェスなどのゲームでは、定められた駒数が記号(symbol)で、ルールに沿ったチェスの動きが構造(structure)です。操作された式は、1つ1つの動きの後、その結果としてもたらされたボード上の駒の配置です。

このAIアプローチから、コンピューターがこの振る舞いを模倣できることがわかります。このアプローチに対する関心は時を経て徐々に薄まりましたが、初めて成果をあげた人工知能のアウトプットの1つとして広く認められているエキスパートシステムの開発へとつながりました。

エキスパートシステム

エキスパートシステムは、人間の専門家(エキスパート)による意思決定能力を模倣することで問題を解決するよう設計されたコンピューターシステムです。このシステムは、知識ベースと推論エンジンの2つのサブシステムを使用します。

トレーニングのため、入力データがエキスパートシステムに提示されます。データはプロダクションルール、つまりIf-Thenルールを介して推論されます。そしてデータと推論を行うプロダクションルールが一緒に、エキスパートシステムの知識ベースを作成します。

推論エンジンは、知識ベースにあるデータや事実にルールを適用し、そこから新たな事実を推論します。

AIプランニング

典型的なAIの一つとして自動化されたプランニングとスケジューリングがあり、それらはAIプランニングと呼ばれます。

AIプランニングは初期状態(initial state)から戦略や一連のアクションを調整し、特定の目標状態(goal state)を達成するシステムです。アクションは、自律ロボット、知的エージェント、自動走行車、あるいはこれらの組み合わせによって実行されます。

この分野のプロジェクト範囲は非常に幅広く、様々な複雑性を伴うため、AIプランニングに必要となるプログラミングに費やされる労力や人的資源は、ほとんどの組織が対応できないほどに膨れ上がりました。

今日では、よりアジャイルなアプローチを提供できる機械学習がこの分野に対応するようになりました。

人工知能の例

すでにおわかりかと思いますが、人工知能がもつ複雑性は非常に多様です。

典型的なAIであるシンプルなルールに基づくエキスパートシステムにあるようなIf-Then文の山だけでなく、学習アルゴリズムを使って予測を生成するより複雑な統計的モデルも含まれます。

さらに、超豪華なコンピューターシステム、特殊ロボット、高性能アンドロイドなど、AIのハリウッド版もあります。

私たちは以前では考えられなかったこのような現実に日に日に近づいているのです。その理由として私たちは現在、コンピューターにどうやって自分で学習し成長するかを教えているからに他なりません。

機械学習とは?

人工知能について理解できたところで機械学習はどうでしょう?AIがおもしろくなるのはここからです。

機械学習とは、大量の入力データを分析し、学習したり意思決定をしたりするよう教えられているコンピューターのことです。

情報を分析し、それに基づいて計算された提案や予測を示し、人間の知能が必要と考えられているタスクを実行します。例として、音声認識、翻訳、視覚認知といったアクティビティがあります。

機械学習の分野には、ディープラーニングの領域も含まれます。機械学習と人工知能の決定的な違いは「学習」という言葉です。

機械学習はなぜ重要か?

コンピューターは学習アルゴリズムをたくみに利用し、インテリジェントな洞察を提供します。

ビジネス上の価値を生み出すため、コンピューターはデータからパターンを学習するようトレーニングされ、それにより自律的に新しいデータや変化するデータに対応できるようになります。

これによりダイナミックなフィードバックループが作成され、さらに洞察を深めるより多くのモデルを効果的に、また一層正確に生成できるようになります。しかもリソースや人間による干渉を必要とすることもありません。

この分野は継続的に進歩しており、コンピューターはますます自己修復、自己編成、自己設計に優れ、より大きなビジネス上の価値をシームレスに生み出すようになりました。

ディープラーニングとは?

ディープラーニングは、人工ニューラルネットワークとも呼ばれ、機械学習の中で最も話題になっている分野です。

ディープラーニングでは、機械学習がレイヤー階層で実行され、1つのレイヤーから出力された決定が、別のレイヤーへと入力されます。

このモデルは脳の神経回路網をおおまかに模倣したもので、音声認識や画像認識への適用においてこれまでにない高い精度を次々と実現しています。

「ディープ(深い)」という言葉は、ネットワーク内のレイヤー数を示しており、1レイヤーのネットワークもあれば、多数レイヤーを利用してよりディープなネットワークを築いているものもあります。

今後の予定は?

本シリーズでは次に、教師あり学習、教師なし学習、準教師あり学習など、機械学習で利用される様々な学習方法、そして皆さんがプロジェクトに利用できるもっとも一般的なアルゴリズムをいくつか取り上げます。

本コースの詳細については、人工知能と機械学習の概論にアクセスしてください。

ビッグデータ/IoT時代のデータ分析プラットフォームまるわかりガイド

ビッグデータ/IoT時代のデータ分析プラットフォームまるわかりガイド
MapRコンバージド・データ・プラットフォームは、ビッグデータのための包括的な統合プラットフォーム機能を提供します。

リアルタイム処理が可能なデータベースに加えて、イベントストリーミング、拡張性の高いストレージ機能により、企業は、バッチ処理用、リアルタイム用といったシステムを組み合わせることなく、たった一つのMapRでデータ活用が可能となります。

このガイドでは、

・なぜ新しいビッグデータ基盤が必要なのか?
・多くの企業が抱えるデータ基盤の課題
・MapRコンバージド・データ・プラットフォームとは?
・MapRでビッグデータ基盤はどう変わるのか
・MapRを採用したお客様の声

を中心にご紹介しています。この機会にぜひご覧ください。

無料ダウンロードはこちら

こちらの記事もおすすめです