HadoopTimes

実践 機械学習:レコメンデーションにおけるイノベーション
技術情報

レコメンドエンジンを利用して購読サービスのチャーンを削減

レコメンドエンジンは、ビッグデータに関する見果てぬ夢のデジタル版だ。 近いうちに、あなたの顧客がいつ何を本当に欲しいのか、分かるようになると想像してほしい。購読サービスにとっては、この夢はさらに輝かしいものだ。顧客が望むものを直接届けることができ、チャーンの劇的な減少に繋げられる。

しかし、これは実際に機能するレコメンドエンジンをあなたが作成できるという仮定の上に立つものだ。私たちは皆、消費者として本当に欲しい物、必要な物、もしくは試してみたいと思わせられる可能性がある物とは何の関係もない製品やサービスを、「パーソナライズされたおすすめ」としてウェブサイトから提供された経験がある。

レコメンド成功への鍵

レコメンドエンジンは、簡単に構築できるように思える―単に、顧客の過去の好みに基づいて、提供中の商品をフィルタリングしているだけだ。問題は、あなたの顧客が今日好きな物は、明日にはもう関心がないかもしれないということだ。

良いレコメンドエンジンは、突然の関心について大局を見据えている―あなたの顧客が本当に子犬のトレーニングについて知りたいのか、ミシシッピブルースを聴きたいのか、あるいはあるトピックやジャンルへの関心が一時的気まぐれや、もう終わったプロジェクトのための調査だったのか?また、顧客に同種の商品をもっと売り出した方がいいか、もしくは、顧客は主要な関心事項の、異なるが関連している側面を探求したいのだろうか?

決定すべきことは多いが、これだけは確かである。多くのデータがあるほど、より良く顧客をセグメント分けして好き嫌いを比較し、彼らが本当に消費したいコンテンツについて、有効かつ興味深いおすすめを生成することができる。

基本的な構成要素

レコメンドエンジンは、事業にかなりの数の加入者がいて、豊富なコンテンツ在庫がある場合、明らかに最もよく機能する。あなたには両方ともあると仮定すると、最初の大きな決定事項は、協調的フィルタリングアプローチを使用するか、それともコンテンツ中心アプローチを使用するかということだ。どうかです。

協調フィルタリングアルゴリズムは、同じセグメント内の他のユーザが好む可能性がある物を予測してレコメンドするために、他のユーザ評価やユーザ行動を利用する。レコメンドエンジンは、何をレコメンドしているのか理解していない―映画が本当に面白いか、音楽が印象的かにかかわらず、レコメンドするために数百万ビットのデータに依拠する。データが多いほど、おすすめは良くなる。また、より多くの顧客がおすすめの適合性をランク付けするほど、エンジンは賢くなる。これはおそらく、最も効果的なアプローチだが、力の源となるデータを書いている新しい事業には適さない。

コンテンツ基盤アプローチは、購読サービスで提供しているコンテンツ向けの優れたタグ付の技術が必要とし、これを使い評価、行動、およびユーザの特定の興味などのユーザデータについて分析することとなる。あなたは商品として適当なものを何でも手に入れられるわけではないだろうから、リアルタイムでレコメンドコンテンツを配信するには、ほぼ確実にアルゴリズム開発予算にお金と時間の両方で相当部分を使うと見込まなければならない。パーソナライズされたレコメンドサービスは…パーソナライズされている必要があるのだ。

顧客と個人的に付き合う

自社エンジンがコンテンツ、協働的アプローチのいずれを利用するか決定したら、既に特定のユーザグループが楽しむ/評価すると知っているコンテンツに基づきペルソナ基盤セグメントを開発するため、顧客プロフィールおよび使用方法の詳細をマイニングするといいだろう。例えば、ニュース購読サービスでは、政治ニュースに非常に興味を持っている加入者のセグメントがあり、別のグループは完全に金融市場に焦点を当てているかもしれない。一部ユーザにはニュース速報をプッシュしたいかもしれないが、他の人は長い通勤中にのんびりと閲覧できる長い形式のコンテンツを楽しんでいるかもしれない。

セグメントを開発したら、最優良顧客にご褒美を与え、新しい顧客を勧誘するため、各グループに合わせた魅力的な商品の開発にデータを再利用できる。また、おそらく競合他社の新しい商品やあなたの商品とへの不満のため―主要な解約イベントが迫っている時を予測するため、顧客の使用パターン、サポートでのやりとり、およびソーシャルメディアでの会話と並行して、ユーザデータを利用できる。同じデータにより、ビジネスでうまくいっているものは何か明らかになるので、あなたはそれをもっと行えるようになる。

データを機能させる

ビッグデータの問題は、それが膨大なことだ。保存と処理で、ネットワークリソースや予算を消費する可能性がある。分離されたサイロのため、データストリームの流れが遅くなり、可用性に影響を与えるかもしれない。ITがデータを準備するための長い待ち時間は、リアルタイムでおすすめを提供する試みを阻害するだろう―リアルタイム容量は、レコメンドエンジンにとって死活的に重要だ。これらや他の煩雑さは、データ―そしてレコメンドエンジン―がその事業可能性を実現できない結果につながる。

Apache Hadoopは、ビッグデータに牽引されたイニシアティブを悩ます問題の全てに対処する。汎用マシンで手頃な価格のストレージを提供し、異なるデータストレージ技術をまたぐ複数ソースからのデータ統合をサポートしている。Apache Drillなどのツールと組み合わせて使用することで、非構造化、半構造化、および構造化データを使用して、セルフサービスでのデータ探索を可能にする。

機械学習について興味があるなら、無料の電子ブック、「実践 機械学習 – レコメンデーションにおけるイノベーション –」の一読をおすすめする。

実践 機械学習 – レコメンデーションにおけるイノベーション –

実践 機械学習 – レコメンデーションにおけるイノベーション –
機械学習とレコメンデーションにおける、もっとも洗練され、効率的なアプローチの1つに至る鍵は、「仔馬が欲しい」という状況の観察の中にあります。

どれを選べばいいのかめまいがするほどの数多くのアルゴリズムがあり、それらの中から選択をするためだけでも、選択肢を理解し、合理的な判断を行うのに必要な、高度な数学の背景知識を十分に持っていることが前提になります。

こちらの資料は、機械学習とレコメンデーションについて学習したいけれど、どこから始めればよいか迷っているという方におすすめです。

無料ダウンロードはこちら

こちらの記事もおすすめです