HadoopTimes

ストリーミングアーキテクチャ Apache Kafka とMapR Streams による新しい設計手法
技術情報

実践的機械学習への招待

この記事は当初O’Reillyのブログに掲載されたものを、許可を得て転載したものです。

車を所有するのは私にとって理に適っているだろうか? 所有するとして私のニーズに最適なのは、ガソリン車、ハイブリッド車、電気自動車のどれだろうか? それは購入するべきか、リースをするべきだろうか?

適切な決定を下すにためには、現実に自分で車を作る方法を知らなくても車の設計、性能およびコストに関して主となる問題を理解する必要がある。自身のビジネスの目標やプロジェクトにとって機械学習がよい選択であるかを決定しようとする場合にも同じことが言える。投入する労力に見合った利点があるだろうか? 特定の状況に対して価値のある結果をもたらす可能性が最も高いのは、どんな機械学習のアプローチだろうか?その機械学習システムを開発・配備・保守するには、どんな技術を持っているどの程度の規模のチームが必要だろうか?

複雑であり、かつては難解だった分野としての機械学習の性格を考えれば (機械学習を理解して運用するのに必要とされる、時として圧倒的な学習アルゴリズムと計算の数々)、多くの人たちがこの問題について少数の人たちに任せておくのがよいと考えるのは当然であろう。

だが、そんな必要はない。アクセシブルな方法で提示するなら、機械学習の中心概念は有用で理解しやすいものだ。学習モデルを実際に自分で作成できる技術のある人たちにとってさえ、基本的な考え方、最良の戦略、異なる設計においてそれぞれの長所と短所を理解することは大きなアドバンテージになる。

だからこそO’Reillyのための最近の報告において、技術的知識の程度にかかわらず大規模なデータセットを扱う仕事に携わるほとんど誰もが利用できるよう、実用的な機械学習への扉を開くことを目指したのだ。我々はレコメンデーションを中心に据える。レコメンデーションは、最もアクセシブルな実用的機械学習のタイプの一つであるとともに、大きな利点をもたらすものでもある。

シンプルであるが強力なレコメンダを構築する方法を知っているだろうか? レコメンデーションが有用かどうかを理解することはもちろん、レコメンデーションの方法を理解するのも考えられているより簡単だ。プロセスを単純化する賢い方法を知っている場合は特にそうだ。適切な種類の単純化は、高品質のパフォーマンスを維持しつつ、レコメンダを構築・インプリを行い、市場投入までの時間を短縮できる。

MapR Technologiesの主任アプリケーション設計者であり、現実の環境において今まで配備された中で最高性能のレコメンダのいくつかを構築した共同執筆者Ted Dunningと協力して、我々はレコメンデーションのための革新的かつ強力な設計を紹介・説明する新しい方法をいくつか探った。単純化したユーザー行動の例から始めて (「ポニーが欲しい」)、模擬ミュージック・リスニング・サイトでのアティストのレコメンデーションを扱う本格的な例へと進む。

このアプローチがあなたに価値があるかどうか、そして自身のチームで構築すると決めた場合にどう技術的細部に取り組んだらいいかを決める際に知っておく必要のあることを説明する。その際、機械学習モデルを構築・訓練するオープンソース・プロジェクトApache Mahoutのアルゴリズムの利用と、レコメンダの配備を大幅に単純化するApache Solrの驚くべき検索技術の利用とを組み合わせていく。

成功した機械学習全ての根底にあるのは、仕事のために適切な入力データを選択する技術である。ここで別のコツが必要になる。つまり大衆に多くの仕事をしてもらうのだ。ウェブサイトでの行動を記録し、人々のすることを「観察」することにより、例えば、人々に何を推薦するべきかの貴重な手がかりである行動パターンを発見できる。この場合、評価において見られるように通常、行動は言葉より雄弁 (または効果的) である。換言すれば、人が「する」ことを観察することで、何を「望んで」いるかを理解できるのだ。

でも忘れないで欲しい。車を買うとしても、私はやはりポニーが「欲しい」のだということは…

英語版はこちらから “Practical Machine Learning: Innovations in Recommendation”
日本語版はこちらから [PDF] 実践 機械学習 – レコメンデーションにおけるイノベーション –

実践 機械学習 – レコメンデーションにおけるイノベーション –

実践 機械学習 – レコメンデーションにおけるイノベーション –
機械学習とレコメンデーションにおける、もっとも洗練され、効率的なアプローチの1つに至る鍵は、「仔馬が欲しい」という状況の観察の中にあります。

どれを選べばいいのかめまいがするほどの数多くのアルゴリズムがあり、それらの中から選択をするためだけでも、選択肢を理解し、合理的な判断を行うのに必要な、高度な数学の背景知識を十分に持っていることが前提になります。

こちらの資料は、機械学習とレコメンデーションについて学習したいけれど、どこから始めればよいか迷っているという方におすすめです。

無料ダウンロードはこちら