バスケット分析とレコメンデーションのアルゴリズム

 バスケット分析とレコメンデーションのアルゴリズムには、いろいろなアルゴリズムがあるそうですが、一番初歩的で基本的なアルゴリズム


【バスケット分析】
 バスケット分析は一回の買い物単位(買い物かご=バスケット)で考えます。


▼基本的に考え方
 ある商品Aが買われる平均の確率を出します。
 そして、ある商品Bを買った場合、ある商品Aの買われる確率が大きく上昇した場合、商品Aと商品Bは関連があると考えるわけです。


▼例
 例えば1万回買い物が行われて、2千回ビールが買われたとします。
 つまり、1回の買い物でビールが買われる確率は20%(0.2)です。
 対して、乾物が1000回買われて、同時にビールが買われたのが500回だとします。この場合、乾物を買っている人が同じ1回の買い物でビールが買われる確率は50%(0.5)です。

 
 確率が上がっていますね。
 つまり、何らかの関連性があると考えるわけです。
 まぁ、単純につまみで買っているのでしょうが。


 乾物を買ってビールを買われる確率/ビールが買われる確率=0.5/0.2=2.5


 今回の事例は、あまりにも判り易く当たり前の例ですが、毎週、毎年やることにより、小さい買い物傾向の変化(流行の前触れ)を知ることが出来ます。


 そして、小さい買い物傾向の変化(流行の前触れ)を早めに探知して情報出しすることにより、需要の開拓を行うことが出来ます。

▼プログラム
 エクセルなどで分析する場合は、テーブルなどを利用します。
 100のカテゴリーを対象とする場合は、
 100×100の表を作り、カテゴリーA(行)が買われた場合のカテゴリーB(列)の回数を地道に記録していきます。



【レコメンデーション】
 レコメンデーションのアルゴリズムはより多彩ですので、ここで紹介するものと全く別のものがあります(というかそっちの方が多い)


 バスケット分析は一回の買い物単位(買い物かご=バスケット)で考えますが、レコメンデーションはユーザー単位で考えます。


▼基本的に考え方
 同じような趣味の人は、同じような本を買うということです。


 書籍Aが買われる平均の確率を出します。
 母数はユーザー数です。
 そして、ある書籍Bを買ったユーザーが、書籍Aも買っている確率を求めます。
 買われる確率が大きく上昇した場合、書籍Aを買ったユーザーは書籍Bを買っていると言えます。

 その場合、書籍Aを買おうとしている、買ったユーザーに対して、書籍Bを進める訳です。


▼注意
 ワンピース1巻を買う人が、2巻、3巻、4巻を買うのは当たり前の行為です。
 2巻、3巻を進めのは良いとしても、20巻、30巻を進めるのは意味がある行為でしょうか?


 ワンピース以外を薦める方が、ユーザーとして嬉しいでしょう。
 単純に相関が高いのを進めるだけでは、驚きがありません。
 こんなものがあるんだと言うマイナーなものの推薦、驚きが重要です。