バスケット分析とレコメンデーションのアルゴリズムには、いろいろなアルゴリズムがあるそうですが、一番初歩的で基本的なアルゴリズム。
【バスケット分析】
バスケット分析は一回の買い物単位(買い物かご=バスケット)で考えます。
▼基本的に考え方
ある商品Aが買われる平均の確率を出します。
そして、ある商品Bを買った場合、ある商品Aの買われる確率が大きく上昇した場合、商品Aと商品Bは関連があると考えるわけです。
▼例
例えば1万回買い物が行われて、2千回ビールが買われたとします。
つまり、1回の買い物でビールが買われる確率は20%(0.2)です。
対して、乾物が1000回買われて、同時にビールが買われたのが500回だとします。この場合、乾物を買っている人が同じ1回の買い物でビールが買われる確率は50%(0.5)です。
確率が上がっていますね。
つまり、何らかの関連性があると考えるわけです。
まぁ、単純につまみで買っているのでしょうが。
乾物を買ってビールを買われる確率/ビールが買われる確率=0.5/0.2=2.5
今回の事例は、あまりにも判り易く当たり前の例ですが、毎週、毎年やることにより、小さい買い物傾向の変化(流行の前触れ)を知ることが出来ます。
そして、小さい買い物傾向の変化(流行の前触れ)を早めに探知して情報出しすることにより、需要の開拓を行うことが出来ます。
▼プログラム
エクセルなどで分析する場合は、テーブルなどを利用します。
100のカテゴリーを対象とする場合は、
100×100の表を作り、カテゴリーA(行)が買われた場合のカテゴリーB(列)の回数を地道に記録していきます。
【レコメンデーション】
レコメンデーションのアルゴリズムはより多彩ですので、ここで紹介するものと全く別のものがあります(というかそっちの方が多い)
バスケット分析は一回の買い物単位(買い物かご=バスケット)で考えますが、レコメンデーションはユーザー単位で考えます。
▼基本的に考え方
同じような趣味の人は、同じような本を買うということです。
書籍Aが買われる平均の確率を出します。
母数はユーザー数です。
そして、ある書籍Bを買ったユーザーが、書籍Aも買っている確率を求めます。
買われる確率が大きく上昇した場合、書籍Aを買ったユーザーは書籍Bを買っていると言えます。
その場合、書籍Aを買おうとしている、買ったユーザーに対して、書籍Bを進める訳です。
▼注意
ワンピース1巻を買う人が、2巻、3巻、4巻を買うのは当たり前の行為です。
2巻、3巻を進めのは良いとしても、20巻、30巻を進めるのは意味がある行為でしょうか?
ワンピース以外を薦める方が、ユーザーとして嬉しいでしょう。
単純に相関が高いのを進めるだけでは、驚きがありません。
こんなものがあるんだと言うマイナーなものの推薦、驚きが重要です。