メニューボタン
DLCP~ディープラーニング資格プラットフォーム~ » ディープラーニングでできること・活用例 » レコメンデーションとは
  

レコメンデーションとは

最近、オンラインショッピングなどをしていて「この商品を買った人はこんな商品も買っています」と、自分が欲しくなるような類似商品が表示されることが多くなっていることに気づいている人も多いのではないでしょうか?

レコメンデーションとは、商品などの情報を収集している人に対し、興味や関心のある情報を提供(レコメンデーション)するシステムです。ディープラーニングを用いたレコメンデーションは、Amazon、Netflix、楽天市場、Facebook、YouTubeなど、さまざまなところで採用されています。

レコメンデーションが用いられている例

世界中に数百万という顧客を持つAmazonでは、ある商品がどんな商品と一緒に購入されているのかを特定するためにレコメンデーションを利用しています。レコメンデーションは商品を購入した顧客によるカスタマーレビュー、購買動向、画面閲覧履歴などに基づいて作成されます。

Netflixでは、映画やテレビ番組視聴者の評価設定やお気に入り設定がレコメンデーション作成に使われています。視聴者に適すると想定される映画や番組情報の提供は視聴者が新しいコンテンツを見つける手助けとなっています。

マッキンゼーのアメリカ法人が2013年に発表したレポートによると、Amazonでの購入者の35%、Netflix視聴者の75%がディープラーニングを用いたレコメンデーションのおすすめであったと報告されています。

レコメンデーションの問題

オンラインショッピングが隆盛を極める昨今、ECサイトや店舗サイトで好きな商品を選び、マウスでクリックするだけで商品を手にすることができます。

オンラインショッピング以前は、商品は棚に陳列しなければならなかったため、各店舗では売れそうな物を選んで陳列せざるをえませんでした。つまり、売れるかもしれない潜在的人気商品は陳列されないままという状態になっていたのです。

オンラインショッピングでは、このような問題はなくなりましたが、新たにロングテール現象という問題が起きています。

商品の売上を棒グラフにすると人気商品は飛び抜けて多くなりますが、あまり人気のない商品は低くなだらかに続くという形になります。このグラフの状態は動物のテール(尻尾)のようであり、長く伸びていくことからロングテールと呼ばれています。

しかしロングテールの中にある人気のない製品の中にも良い製品があります。そして、それをウェブサイトから見つけるためのフィルターとなっているのがレコメンデーションシステムなのです。

ロングテール現象

インターネットにおける小売りの世界ではこれらの捉え方ではうまく当てはまらず、テール部分が全体を構成する、いわゆる、べき乗分布をして いる。
例えば、図 1 のように、横軸に商品の売り上げ順位、縦軸に販売量をとると、インターネットの小売販売は右にロングテールで伸びた図となる。非常に重要なのはテール部分で あり、年間を通して僅かしか売れていないが、これらの商品を集約すると売上全体の 9 割を占める。このロングテール現象を実証研究したところ、商品販売だけでなく、対象分野 や対象期間・時間を問わず、ユーザーにまつわる行動情報の分布は全てロングテールで表現されうることが明らかになった。テール部分が全体を占める場合、ビッグデータの処理 は AI を使うことでしか解決できない。

「第9章(講演録)専門家を無力化させる「個別化」時代の衝撃」(森 正弥)
https://www.mof.go.jp/pri/research/conference/00report/inv2017/inv2017_report09.pdf

参照:The Remarkable world of Recommender Syste/Parul Pandey:

https://towardsdatascience.com/the-remarkable-world-of-recommender-systems-bff4b9cbe6a7

予測バージョン

予測バージョンでは商品とユーザの結びつきに関する評価を予測します。

これまで営業活動において需要の予測をすることは難しいことでした。しかしレコメンデーションシステムにより、かなり高い精度での需要予測が可能です。

たとえば、あまり売れそうもないマイナー商品が実際にどの程度売れるのかについても、購入者から得られた膨大なデータに、イベントや季節などの要素を加えて販売予測が可能となっています。

ランキングバージョン

ランキングバージョンでは、特定の商品に対するユーザの評価予測だけを必要としているわけではありません。ユーザの評価にはあまり興味がなく、売れる商品をランキングリストとして顧客に示すことが重要だと考えているEC業者や小売業者もいるからです。

顧客情報の分析だけにこだわらず、単純にネットで公表されている情報も利用すべきであるとし、サイトで商品人気ランキングを紹介して情報更新頻度を上げたところ、売上が向上したというECサイトの例もあります。

レコメンデーションシステムの目的

レコメンデーションシステムの目的は企業の売上を増やすことです。そのためにはユーザが好む商品を紹介する必要があります。レコメンデーションシステムに必要とされる目標には以下の4つがあります。

関連性

あるユーザにおすすめされている商品が、そのユーザの興味あるものであれば意味ある提案となり、ユーザが商品を購入する可能性も高くなります。

新規性

新規性も重要です。あるユーザにおすすめされた商品が、今まで見たことのないものであったり、購入したことのないものであったりすれば、ユーザにとって意味ある商品となります。

セレンディピティ

予期していなかった素晴らしい発見をする能力のことをセレンディピティといいます。もしセレンディピティがあれば、楽しい人生が送れるはずですが、このような能力を持っている人は少ないです。しかし誰でもセレンディピティ体験ができるというのがレコメンデーションシステムのよいところです。ユーザが最も必要としている情報をネット上の膨大なコンテンツの中から探し出してくれるからです。

多様性

レコメンデーションには多様性も重要です。単純に似たようなものをおすすめしても、購入には結びつかないでしょう。似ているだけではなく、そのユーザの嗜好や購買履歴など、さまざまなデータを加味したものをおすすめする必要があります。

レコメンデーションシステムの仕組み

レコメンデーションシステムの仕組みについてAmazonがユーザに対しおすすめ書籍を提供する場合を例にあげましょう。

Amazonのディープラーニングを用いたレコメンデーションシステムではユーザの関心と好みを知るためにユーザの蓄積されたデータを利用しています。あるユーザへのおすすめ商品は、そのユーザのデータと、他の似ているユーザのデータを合わせて選び出しています。

ユーザの好みに関するデータは以下にあげる2つの方法で収集されます。

明示的データ

ユーザがレビューで1~5の星マークをつけたり、見た商品に「いいね」をつけたりするのは明示的データとして収集されます。このデータはユーザ関心のプロファイルに格納されていきます。

しかし全てのユーザが明示的に評価をするわけではなく、また星3つが平均と考える人もいれば星3つが劣っていると考える人もいるためユーザによって評価基準が異なるというデメリットもあります。

暗黙的データ

そのサイトに関心を持っているかどうかなど、ユーザとサイト間の関係から抽出されるデータは暗黙的データとして収集されます。

たとえば「閲覧した」「商品を購入した」「動画を最後まで視聴した」という行動は、ユーザの積極的な関心の表れとみなされます。

レコメンデーションシステムの類型

レコメンデーションシステムは、基本的に「収集されたデータをもとに、おすすめ情報を決定して提案(表示)する」という仕組みで、ディープラーニングの活用により複数プラットフォームにまたがった複雑な環境でもレコメンデーションが可能となっています。

現在利用されているレコメンデーションシステムには多くの種類があります。そのため、レコメンデーションシステムを採用する場合には、どのシステムが利用事業者や企業のニーズに合うのか、どんなデータが利用できるのかについて、判断しなければなりません。
レコメンデーションシステムには以下の3つの手法があります。

コンテンツベース・フィルタリング

コンテンツベース・フィルタリングは、コンテンツ自体の持つ属性から推奨するものを決定する手法です。レコメンデーションシステムでは個人の履歴情報を利用して、過去の購入履歴、「いいね」をした商品、その商品にある類似性を探しておすすめ情報を提案します。

たとえば、ある小説家の書籍に興味を持っているユーザであれば、同じ小説家の他の書籍や似たようなジャンルの小説がおすすめされます。

コンテンツベース・フィルタリングは製品情報のみが必要で大量のトランザクションが不要というメリットがありますが、学習しないので長期間運用しても動作しても進歩がないというデメリットがあります。

協調的フィルタリング

協調的フィルタリングはコンテンツの関係ではなく、他ユーザの購入、閲覧、評価等の履歴、つまり協調的な行動にもとづいて、おすすめを決めるという手法です。

協調的フィルタリングには、トランザクションデータをレコメンドにそのまま利用するメモリーベースアプローチと事前にモデル構築を行うモデルベースアプローチの2つのアプローチがあります。

【メモリーベースアプローチ】

類似ユーザの関心のあるアイテムをレコメンドするユーザベースと、ユーザ履歴からアイテム間の関係によりレコメンドするアイテムベースの 2つの手法があります。

【モデルベースアプローチ】

モデル構築を行ってレコメンデーション問題を機械学習問題として処理することで、評価データに関する予測を抽出するモデルベースの方法です。モデルベースアプローチでは特異値分解、主成分分析、行列分解、ニューラルネットワーク、クラスタ分析などの技法が使われます。

ハイブリッドあるいはアンサンブルベース

コンテンツベースと協調フィルタリングには、それぞれメリットとデメリットがありますが、この2つの手法を結合させることで、より良いリコメンドシステムを作ることができます。ハイブリッドシステムはアイテムデータとトランザクションデータを合わせたリコメンドによって、より的確なおすすめ情報をユーザに提供します。

ハイブリッドシステムを利用している例にNetflixがあります。Netflixではユーザの視聴と検索(協調的フィルタリング)だけでなく、似たような特徴を持つ映画や番組(コンテンツベース)の両方をもとにして、おすすめ番組が提供されています。

ディープラーニングでできること・活用例を見る