満足度調査の集計が終わって、属性別スコアと総合満足度が並んだ。次に来る問いはいつも同じです。「総合満足度を上げたい。じゃあ、どの項目を上げれば総合満足度が上がるの?」
ここで多くの人が、各属性と総合満足度の 相関係数を一覧にして「相関が高い順がドライバーです」 と報告します。それ、半分は罠です。相関は「一緒に動いている」ことを見ているだけで、「ここを上げれば総合が上がる」とは限らない。しかも属性同士が相関していると、同じ重要度を二重・三重に計上してしまう。キードライバー分析(Key Driver Analysis, KDA) は、この"見かけの重要度"を統計的にほぐして、本当に効いている要因を取り出すための技術です。本稿では、相関の限界から、重回帰の多重共線性、それを解くShapley値・相対的重み付け、そして「相関と因果を混同しない」という最大の作法までを、実務の手触りで整理します。
1. キードライバー分析とは — 「何が効くか」を数値化する
キードライバー分析は、1つのアウトカム変数(総合満足度・NPS・継続意向など)を、複数のドライバー変数(属性ごとの満足度)でどれだけ説明できるか を分解し、各ドライバーの「効き具合(重要度)」を数値で出す分析です。
例えば、SaaS の満足度調査で「総合満足度」を従属変数、「サポート満足度」「機能満足度」「価格満足度」「UI満足度」を独立変数に取り、「総合満足度を最も強く動かしているのはどれか」 を特定します。出てくるのは「導出重要度(derived importance)」——回答者に重要度を直接聞かず、データから統計的に導いた重要度です。
この導出重要度は、前回の 重要度-満足度分析(IPA)ガイド で「重要度の測り方」として登場した概念そのものです。KDA で重要度を算出し、IPA の4象限に載せて優先順位を決める ——この2つはペアで使う前提の分析です(第7章で接続を詳述)。
相関・回帰の基礎的な集計は アンケート集計と有意差判定ガイド で扱っています。本稿はその応用として、「複数要因の中で何が効くか」を切り分ける話に踏み込みます。
2. なぜ「相関係数の一覧」ではダメなのか
最も手軽なKDAは、各ドライバーと総合満足度の ピアソン相関係数 を計算して、高い順に並べる方法です。Excel の CORREL 関数でも出せます。当たりをつける一次スクリーニングとしては有効ですが、これを最終結論にすると2つの理由で間違えます。
理由1: 重要度の「二重計上」
属性同士は、たいてい相関しています。「サポートの速さ」と「サポートの丁寧さ」は一緒に高くなりがちです。この2つを別々に相関で見ると、両方とも高い相関 を示します。しかし実態は「サポート体験」という1つの塊が効いているだけかもしれない。相関の一覧は、相関し合う要因の重要度を 重複してカウント してしまい、「サポート関連が上位を独占」という歪んだ絵を描きます。
理由2: 他の要因を考慮しない
相関は「2変数だけ」を見ます。「価格満足度と総合満足度の相関が高い」としても、それは価格そのものではなく、価格と相関している別の要因(コスパ感、期待値) が効いている可能性を切り分けられません。
そこで、複数の要因を同時に考慮して、各要因の"純粋な"寄与を取り出す 必要が出てきます。それが次の重回帰分析です。
3. 重回帰分析と「多重共線性」という罠
重回帰分析は、総合満足度を全ドライバーで同時に説明し、標準化偏回帰係数(β) を各ドライバーの重要度とみなす方法です。「他の要因を一定としたとき、この要因が1標準偏差動くと総合満足度がβ標準偏差動く」という、相関より一歩進んだ純寄与を出せます。
ところが、KDA で重回帰を使うと ほぼ必ず多重共線性(multicollinearity)の罠 にはまります。
多重共線性とは何が起きるのか
ドライバー同士が強く相関していると(例: サポートの速さ と 丁寧さ が相関 0.8)、回帰は「どちらの手柄か」を決められず、係数が不安定になります。具体的には:
- 係数の符号が反転する(重要なはずの「サポートの速さ」の係数が マイナス になる)
- サンプルを少し変えるだけで係数が大きく振れる
- 標準誤差が膨らみ、有意でなくなる
経営会議で「サポートの速さは総合満足度に マイナスの影響 があります」と報告したら、誰も信じません。そして、それは正しい不信です——その負の係数は現実ではなく、多重共線性が生んだ統計的アーティファクト だからです。
検知の仕方
多重共線性は VIF(分散拡大係数, Variance Inflation Factor) で検知します。目安として VIF が 5 を超えたら警戒、10 を超えたら明確に問題ありとされます。属性間の相関行列を見るだけでも、相関 0.7 以上のペアがあれば赤信号です。
問題は、顧客満足度の属性は 構造的に相関し合う(満足な顧客は何でも高く評価する)ため、多重共線性は「たまに起きる」のではなく「ほぼ常に起きる」点です。だからKDAでは、素の重回帰係数をそのまま重要度にしてはいけません。
4. 多重共線性を解く — Shapley値と相対的重み付け
多重共線性を回避しつつ、安定した重要度を出すための手法が 相対的重み付け(Relative Weights) と Shapley値分析 です。これが現在のKDAの実務標準です。
キードライバー分析の4手法 — 精度と手軽さのトレードオフ
Shapley値・相対的重み付けの考え方
両者は発想が近く、「あるドライバーを説明変数に加えたとき、説明力(R²)がどれだけ増えるか」を、変数を投入する順番のあらゆる組み合わせで平均する ことで、各ドライバーの公平な貢献度を出します。Shapley値はゲーム理論由来で、Kruskal (1987) や LMG 法として知られ、Johnson (2000) の相対的重み付けはその計算負荷を抑えた近似です。
実務上の最大の利点は、重要度が必ず非負で、合計がモデルの R² に一致する こと。「サポートが全体の説明力の 32%、価格が 21%……」のように、寄与率として直感的に解釈できる 数字が出ます。経営会議で「マイナスの重要度」を説明する地獄から解放されます。
計算は Excel 標準機能では難しく、R の relaimpo パッケージ(Grömping 2006)、Python、専用の調査分析ツールなどで実施します。Tonidandel & LeBreton (2011) は、相対重要度分析が回帰分析の有用な補完になることを実務寄りに整理しており、導入の足がかりになります。
5. 相関と因果を混同しない — KDA 最大の誤読
ここがキードライバー分析で 最も多く、最も致命的に間違える ポイントです。KDA が出すのは 相関(association)であって、因果(causation)ではありません。
「サポート満足度が総合満足度を強く説明する」という結果は、「サポートを改善すれば総合満足度が上がる」を保証しません。次の落とし穴が常に潜みます。
逆向きの因果(ハロー効果)
総合的に満足している顧客は、個別の属性も何となく高く評価 します(ハロー効果)。すると「総合満足度が高い人はサポートも高評価」という相関が出ますが、これは「サポートが総合を上げた」のではなく「総合的な満足がサポート評価を底上げした」逆向きの関係かもしれない。KDA だけでは、この向きを判定できません。
交絡
サポートと総合満足度の両方を、観測していない第三の要因(例: 顧客の習熟度、相性)が同時に押し上げている可能性もあります。
実務での向き合い方
- 「ドライバー」を「改善すれば必ず効くレバー」と言い換えない。「総合満足度と強く連動している要因」という表現にとどめる
- 重要度上位の要因について、可能なら A/B テストや施策前後比較で因果を検証 する。KDA は「どこを検証すべきか」の優先順位づけであって、因果の証明ではない
- 報告書に 「これは相関に基づく重要度であり、因果効果の保証ではない」の一文を必ず添える
謙虚さがKDAの信頼性を守ります。「効く要因を見つけた」ではなく「効いていそうな仮説を、根拠の強い順に並べた」が正確な言い方です。
6. アウトカム変数の選び方と「満足の非対称性」
何を従属変数に置くか
KDA は アウトカム変数の選択で結論が変わります。総合満足度なのか、NPS(推奨意向)なのか、継続意向なのか、再購入なのか。それぞれドライバーが違います。
- 総合満足度 を従属変数にすると「今の体験を構成する要因」が出る
- 継続意向 / NPS を従属変数にすると「将来の行動を左右する要因」が出る(NPS の読み方とベンチマーク 参照)
「満足度は高いのに解約する」現象を追うなら、従属変数は満足度ではなく 継続意向 であるべきです。目的に対してアウトカム変数がズレていると、その先の分析がすべて空振りします。
満足の非対称性(Kano)を見落とさない
通常の回帰は「ドライバーが上がれば総合も比例して上がる」直線関係を仮定しますが、現実は非対称です。IPA ガイドの Matzler et al. (2004) でも触れた通り:
- 当たり前品質: できていて当然。欠けると総合が大きく下がるが、満たしても総合は上がらない
- 魅力品質: なくても不満はないが、あると総合が跳ねる
これを捉えるには、ドライバーを「高評価ダミー」「低評価ダミー」に分けて回帰する ペナルティ・リワード対比分析(penalty-reward contrast analysis) を使います。「重要度が高いのに、実は不満解消にしか効かない(直しても満足は上がらない)」要因を見分けられます。
7. IPA との接続 — KDA の出力を4象限に載せる
キードライバー分析と 重要度-満足度分析(IPA) は、入力と出力の関係 でつながります。
- KDA で導出重要度を算出: Shapley値 / 相対的重み付けで各ドライバーの寄与率を出す(縦軸の材料)
- 各ドライバーの満足度(パフォーマンス)を集計: 平均値や Top 2 Box(横軸の材料)
- IPA の散布図に載せる: 縦軸=KDA の導出重要度、横軸=満足度
- 4象限で優先順位を読む: 「重要度(KDA)が高いのに満足度が低い」=重点改善領域
この流れにすると、IPA の弱点だった 「重要度を直接質問で測ると天井効果で潰れる」問題を、KDA の導出重要度が解決 します。KDA が縦軸を作り、IPA が意思決定の地図を描く。KDA + IPA = 改善優先順位づけの完成形 です。
満足度(パフォーマンス)側の測り方は 顧客満足度(CSAT)の設計ガイド、必要なサンプルサイズは 必要サンプルサイズの決め方 を参照してください。
8. 編集部の視点 — キードライバー分析でやってはいけない5つ
業界事例と実務担当者の声を継続的に追っている立場から、KDA で繰り返し起きる事故を5つ。
1. 相関係数の一覧を「ドライバー分析」と呼ぶ
最頻出です。相関の高い順を並べただけのものを「キードライバー分析しました」と報告する。相関は二重計上するので、相関し合う要因群(サポート関連など)が不当に上位を独占 します。一次スクリーニングは相関でよいが、結論は必ず相対的重み付け / Shapley で出す。
2. 重回帰の負の係数をそのまま報告する
多重共線性で出た「重要なはずの要因のマイナス係数」を、検算せずレポートに載せる。読み手は一発で「この分析おかしい」と見抜きます。VIF を必ず確認し、共線性があれば相対的重み付けに切り替える。素の回帰係数をKDAの最終アウトプットにしない。
3. 「ドライバー=改善すれば効くレバー」と断言する
KDA は相関であって因果ではない。「サポートが最大ドライバー → サポートに投資すれば総合満足が上がる」と断言した施策が空振りし、「分析を信じたのに」と分析自体の信頼が失われる。「連動の強さ」と「改善効果」を言葉で区別し、上位要因は A/B テストで因果を検証する。
4. アウトカム変数を惰性で「総合満足度」にする
目的が「解約を減らす」なのに従属変数を総合満足度にすると、解約と無関係なドライバーが上位に来る。目的(満足 / 継続 / 推奨 / 再購入)に応じてアウトカム変数を選ぶ。ここを惰性で決めると、その後の精緻な分析がすべて無駄になります。
5. サンプルサイズと変数の数を釣り合わせない
説明変数が 30 個あるのに N=80 で回帰を回すと、過学習で重要度がデタラメに振れます。目安として 説明変数 1 つあたり 10〜15 サンプル は欲しい。変数が多すぎるなら、因子分析で次元を圧縮するか、ドメイン知識でグループ化してから投入する。
9. アンケートツール Kicue でのキードライバー分析運用
KDA は「ドライバーとアウトカムを測る設問設計」と「相対的重み付け等で重要度を算出する分析」に分かれます。Kicue が担うのは前者で、後者は外部の統計ツールとの組み合わせになります。
- ドライバー・アウトカム設問の設計: 各属性の満足度(ドライバー)と、総合満足度 / NPS / 継続意向(アウトカム)を、同一フォーム内のリッカート尺度で測る設計に対応(設問タイプ・リッカート尺度の設計ガイド)
- 回答者 ID 付き CSV エクスポート: 1 行 1 回答で属性満足度と総合満足度を並べた、回帰分析にそのまま投入できる構造で出力
- GT 集計・クロス集計: 各ドライバーの平均値・分布の確認、相関の一次スクリーニング前の素データ確認まではダッシュボード上で可能
⚠️ Kicue で対応できない範囲
- 相関・重回帰・相対的重み付け・Shapley値の計算機能はなし: 統計解析は R(relaimpo 等)/ Python / SPSS / JASP で実施。Kicue 自体には統計解析機能を持たせていません
- VIF・多重共線性の診断もなし: エクスポート後の統計ソフト側で実施
- ランダムフォレスト等の機械学習もなし: Python(scikit-learn 等)で実施
- IPA の散布図作成もなし: KDA の導出重要度を縦軸に置く散布図は Excel / R / Python で作図
関連記事として 重要度-満足度分析(IPA)ガイド・顧客満足度(CSAT)の設計ガイド・NPS の読み方とベンチマーク・アンケート集計と有意差判定ガイド・VoC プログラム設計ガイド を併読すると、「測る → 効く要因を特定(KDA)→ 優先順位(IPA)→ 運用」の分析パイプライン全体が見えてきます。
まとめ — キードライバー分析を信頼できる分析にする6点
- 相関の一覧は一次スクリーニングまで — 二重計上するので結論にしない
- 重回帰は多重共線性を疑う — VIF を確認し、負の係数を鵜呑みにしない
- 重要度は相対的重み付け / Shapley で出す — 非負・合計が R² で、寄与率として解釈できる
- 相関と因果を区別する — 「連動の強さ」であって「改善効果の保証」ではない。上位は A/B テストで検証
- アウトカム変数を目的に合わせる — 解約対策なら継続意向、体験改善なら総合満足度
- 説明変数 1 つあたり 10〜15 サンプル — 変数が多すぎるなら因子分析で圧縮
キードライバー分析は「どの統計手法を使うか」より、多重共線性と因果の2点を外さないこと で信頼性が決まります。この2つさえ守れば、「何から手をつけるか」の議論を、感覚論から数字の議論へ引き上げられる強力な武器になります。
ドライバーとアウトカムを測る調査を設計したい方は、無料のアンケートツール Kicue を試してみませんか。属性満足度と総合満足度・NPS を同一フォームで測るリッカート設問設計、回帰分析にそのまま投入できる回答者 ID 付き CSV エクスポートまで、キードライバー分析の入力データを作る部分を 1 アカウントで開始できます(相関・重回帰・相対的重み付け・Shapley値・VIF 診断は R / Python / SPSS / JASP との組み合わせ運用となります)。
参考文献 (5件)
- Johnson, J. W. (2000). A Heuristic Method for Estimating the Relative Weight of Predictor Variables in Multiple Regression. Multivariate Behavioral Research, 35(1), 1-19.
- Kruskal, W. (1987). Relative Importance by Averaging Over Orderings. The American Statistician, 41(1), 6-10.
- Grömping, U. (2006). Relative Importance for Linear Regression in R: The Package relaimpo. Journal of Statistical Software, 17(1), 1-27.
- Tonidandel, S., & LeBreton, J. M. (2011). Relative Importance Analysis: A Useful Supplement to Regression Analysis. Journal of Business and Psychology, 26(1), 1-9.
- Azen, R., & Budescu, D. V. (2003). The Dominance Analysis Approach for Comparing Predictors in Multiple Regression. Psychological Methods, 8(2), 129-148.
