どうも、Tomatsuです。
支持度・信頼度・リフト値などのマーケットバスケット分析の計算式が覚えられず、ID-POSデータ系の問題が解けません
どうすればよいでしょうか?
こんな疑問にお答えします。
支持度・信頼度・リフト値・Jaccard係数を分かりやすく解説します
記事を書いている私は、財務・会計関連の「知識ゼロの状態」から、中小企業診断士試験にストレート合格しました。
現在は会社員をやりながら、診断士受験用のテキスト本の執筆や、受験生支援ブログにて執筆活動(一発合格道場)を行っています。
効率的な勉強法には自信がありますし、結果も出してきていると言えます。
支持度・信頼度・リフト値・Jaccard係数を分かりやすく解説
ID-POSデータ系の問題は意外に正答率が低いです。
苦手意識を持った方は闇雲に計算式を暗記しようとしている可能性があります。
本記事の図解を使って各指標の意味をしっかり理解しましょう。
近年頻出問題となっていますので重要性は増してきております
重要となる指標
重要となる指標は下記の通り。
絶対おさえておきたい指標
- 支持度(サポート)
- 信頼度(コンフィデンス)
- リフト値
余裕があればおさえておきたい指標
- Jaccard係数
H29の問題を例に一つずつ確認していきましょう。
【運営管理】H.29 第40問
あるスーパーマーケットの、ある期間に購買のあった顧客1,000人のID-POSデータを用いて、顧客が当該期間内に購入する商品の組み合わせを分析した。その結果、商品Aの購入者が200人、商品Bの購入者が250人、商品Aと商品Bの両方の購入者が100人であった。
(設問1)
「商品Aを購入した当該顧客の何パーセントが商品Bを購入するか」という値を、商品Bのプロモーションを検討する材料として計算したい。このときこの値は、一般に何と呼ばれる値か、最も適切なものを選べ。
(ア)Jaccard係数
(イ)支持度(サポート)
(ウ)信頼度(コンフィデンス)
(エ)正答率
(オ)リフト値
(設問2)
設問1の「商品Aを購入した当該顧客の何パーセントが商品Bを購入するか」という値を実際に計算したとき、最も適切な値はどれか。
(ア)15%
(イ)20%
(ウ)25%
(エ)40%
(オ)50%
支持度(サポート)
支持度(サポート)は調査対象人数のうち両方の商品を買った人数をあらわします。
支持度が高いということは商品の組み合わせが売上全体に与える影響が大きいことが示唆されます。
信頼度(コンフィデンス)
信頼度(コンフィデンス)は片方の商品を買った人がもう一つの商品を同時に買う確率をあらわします。
上記は商品Aからみた商品Bとの信頼性をあらわします。
(商品A→商品Bの信頼性:50%)
商品Bからみた商品Aの信頼性は異なることを認識しておきましょう。
(商品B→商品Aの信頼性:40%)
この数字が高ければ高いほど商品の併売可能性が高いと判断され、クロスマーチャンダイジングの重要性が高まると考えられます。
ただし注意が必要です。
例えば商品Bが調査対象者1,000人中900人が買うような超人気商品だとします。
上図はさきほどと同様、商品Aからみた商品Bとの信頼性が50%の状況をあらわしますが、これによって商品AとBが併売される傾向にあると断定できるでしょうか?
答えはNoですよね。
商品Bの人気に数字が引っ張られているだけなのですから。
上記のような状況でも両商品の関係性を正しく判断するために用いられるのが次に説明する「リフト値」です。
リフト値
リフト値はある商品の購入(例えばA)がその他の商品(例えばB)の購入率をどの程度持ちあげるか(リフトするか)をあらわします。
一般的にリフト値が1.0を超えると両商品の関係性には一定の意味があると判断され、2.0を超えると両商品の関係性が高いと判断されます。
仮に信頼度(コンフィデンス)が高めでも、それが他商品の人気に引っ張られている場合は、リフト値が下がります。
Jaccard係数
Jaccard係数は二つの商品がどのていど類似しているかをあらわします。
二つの集合がどの程度似ているかを表す。
Jaccard係数が大きい場合、商品Aを買った人は同時に商品Bも買いやすいと判断できます。
診断士試験ではあまり問われませんが、出題されたときに慌てないよう、こんな指標もあったな~という程度に覚えておいてください。
まとめ
ID-POSデータを用いたマーケットバスケット系の問題は指標の定義さえ覚えていれば必ず解けます。
やみくもに計算式を暗記しても定着しづらいので、図解で意味をしっかり理解しながら勉強を進めてみて下さい。
それでは最後まで読んで頂きありがとうございました。