読者です 読者をやめる 読者になる 読者になる

About connecting the dots.

statistics/machine learning adversaria.

Amazonのレコメンドメールの送信パターンについて調べてみた

あけましておめでとうございます.本年もよろしくお願いします.データサイエンティストは既に衰退期に入っているみたいですが,変わらず淡々とやるべきことをやっていきたいと思います.

ここ2年くらい真面目に働くようになった所為で,Amazonでものを買う機会が飛躍的に増えたんですが*1,それとともにAmazonのレコメンドメールも凄まじい物量で届くようになりました.そんなわけで今回は,自分のアカウントをサンプルとして,Amazonでの購入行動とレコメンドメールの関係をみていきたいと思います.

購入履歴とレコメンドメール

単純集計

さすがに購入詳細をさらすのはアレなのでしませんが,ざっくり購入点数と購入総金額,またその年にきたレコメンドメールの総数をカウントしてみたところ,以下のようになりました.これだけみると,購入点数が多いほどレコメンドメールも多く届くようにみえますね.

購入点数 購入総金額 レコメンドメール数
2012 34点 164325円 93通
2013 85点 135392円 166通

時系列

続いて,上記の3つの値について,時系列での推移をみていきたいと思います.購入金額には波があり,買う月と買わない月の差が激しいのですが,点数自体は割と安定して月に5点前後を買っている形です.

これに対して,レコメンドメールは2012の秋から急激に上昇して,それ以降は安定的に送られ続けているようですね.これはあくまで印象論でまったく確証はないのですが,2012年の4-8月の購入金額が合計10万円を超えたあたりで,Amazon内部で持っているユーザセグメントのうち,1つ上のセグメントに移ったのかなと思われます*2

つまりは「こいつはうちでガンガン金使ってくれるっぽいから,レコメンドメール送りまくってやれ」という認識をされたんでしょうね,きっと.

2013年にはいってからは,おおむね毎月コンスタントに購入しているので,セグメントの変化もなく普通にメールが届き続けています.

f:id:SAM:20140104142944p:plain

レコメンドメールの内訳

時系列

ここまでレコメンドメールと一緒くたにしてきましたが,レコメンドメールの内訳はどうなっているでしょうか.ということで,これを時系列にして積み上げ面グラフで表してみると,以下のようになります*3

f:id:SAM:20140104145030p:plain

アイテムベースレコメンド

一番多いのは,アイテムベースのレコメンドですね*4.これは「○○をチェックされた方に××をお勧めします」みたいなもののことですね.具体的には以下のようなメールを意味します.

f:id:SAM:20140104145745p:plain

セール案内

次に多いのはセール案内です.これは特に,2012年の9月から翌3月くらいまでやたらにたくさん送られてきました.2013年の年末にも送られてきているところをみると,単純にボーナスやらクリスマスやらのイベントがあるときには全ユーザに送るんでしょう.それ以外に,セグメントが上にあがった場合には半年間プロモーションしまくる,みたいなのがあるのかなぁと思います.ちなみにセール案内というのは,以下のような文面のものです.

f:id:SAM:20140104150535p:plain

購入・閲覧履歴

いわゆるパーソナライズレコメンドですね.アイテムベースほどではないですが,コンスタントにそれなりの数が送られてきています.具体的な文面は以下の通りです.

f:id:SAM:20140104151323p:plain

ちなみに,Amazonは内部で複数のレコメンドアルゴリズムを用いているようで,文面にも複数のパターンがあります.

f:id:SAM:20140104151545p:plain

Kindle

これはKindle本体もしくはKindle本についてのレコメンドメールです.私自身は,昨年の12月にKindle paperwhiteを買ったのですが,それとは関係なく,AmazonがKindleのプロモーションをかけているときにガンガン送られてくるようです.

f:id:SAM:20140104151919p:plain

カテゴリレコメンド

ある商品カテゴリを閲覧した人に対して,そのカテゴリ全体のうちのおすすめ商品をレコメンドするものです.これはセール案内と同じような時期に激増していますね.ちなみに文面は以下のようなものになります.

f:id:SAM:20140104152839p:plain

そのほかのものについては,件数も少ないので省略ということで.

レコメンドメールの送り方

全体

こうやってまとめてみたんですが,どういう規則でメールを送っているのか,というのについては正直わからない感じです.特にアイテムベースのレコメンドなんていうのは,単にどこかのブログに載っていたリンクを軽くポチっただけで送られてきたり,ひどいのになると,どこでみたのか覚えてもいないものが元アイテムとしてレコメンドされたりします.このあたりは,直接Amazonにいっておすすめ商品から外せばいいんでしょうけど,それは今回の範囲を超えている話なので...

曜日

購入については,明確に土日に偏っているわけですが,その一方でレコメンドについてはすべての曜日にまんべんなく送られてきています.このあたりは興味深いですね.金曜や土曜に重点的に送っても,特に売り上げには影響がなかったということなんでしょうか.

f:id:SAM:20140104155209p:plain

まとめ

今回の集計からわかったのは,だいたい以下のような事柄です.

  • Amazonは閲覧/購入に応じたユーザセグメントが存在していて,それ毎に異なったレコメンドメール戦略を取っているっぽい
  • 特にセグメントがあがったときには集中的にセール情報や一般的なレコメンドを大量に送ってくるっぽい
  • 週末に合わせてレコメンドメールを送るといったことはしていない
  • どのタイミングで,どのレコメンド文面を使っているのかについては,正直よくわからない

本来なら,もう少しサンプルを集めて背景まで突っ込んでいきたいところですが,サンプルを増やすのが無理なので,とりあえずこんなところで.

*1:金を稼いでも使う時間がないのと,可処分所得が増えたのとの両方ですね

*2:後述するように,実際には購入しなくてもAmazonで商品を閲覧しているだけでも,Amazon的なポイントがプラスされていくようです.で,そんなに欲しそうにみてるなら,You買っちゃいなYO! とばかりにメールが送られてくる,と.ただまぁ自分がAmazonにどの程度アクセスしているかなんて,後からデータとして集めようもないわけですが...

*3:各カテゴリ分けは,ある程度はPythonの文字列マッチングで処理しましたが,最終的には微妙なものの分類について人力マイニングをしています

*4:ここでは,レコメンドロジックの詳細に踏み込む気はいっさいないので,ベースになっている協調フィルタリングとか,その他諸々の手法を知りたい方は,しましま先生の論文あたりをお勧めします: http://www.kamishima.net/archive/2007-s-jsai_rsys.pdf