顧客セグメンテーション調査 — クラスター分析で顧客を分ける

キードライバー分析で「総合満足度を動かすのはサポートだ」と分かった。重要度-満足度分析で「重点改善はサポートと価格だ」と決まった。でも、その結論には 隠れた前提 があります。「顧客は1つの塊だ」 という前提です。

実際には、価格にシビアな新規顧客と、機能の深さを求めるヘビーユーザーでは、満足度を動かす要因がまるで違う。全体平均で「サポートが効く」と出ても、それは2つの異なる顧客群を混ぜて均した結果で、どちらの顧客にとっても正確ではない ——統計学でいう「平均的な顧客は実在しない」問題です。これを解くのが 顧客セグメンテーション調査 です。アンケートデータから「似た者同士の塊」を見つけ、塊ごとに戦略を変える。本稿では、分類の2大アプローチから、分類軸の選び方、クラスター分析の手法、セグメント数の決め方、そして「使えるセグメントの条件」までを、実務の手触りで整理します。

1. なぜセグメンテーションか — 全体平均という罠

キードライバー分析も重要度-満足度分析（IPA）も、強力ですが 「回答者全体を1つの母集団として平均する」 点が共通の弱点です。

異質な顧客を混ぜて平均すると、シンプソンのパラドックス に近い現象が起きます。「全体ではサポートが満足度の最大ドライバー」でも、セグメントAでは価格が、セグメントBでは機能が最大ドライバー、というのは日常茶飯事です。全体平均だけで意思決定すると、どのセグメントにも刺さらない、平均的で凡庸な施策 に投資してしまう。

セグメンテーションの目的は単純です。「似た反応をする顧客の塊」に分けて、塊ごとに最適な打ち手を変える。マーケティングの古典 Smith (1956) が「製品差別化」と対比して「市場細分化」を提唱して以来、セグメンテーションはマーケティング戦略の土台であり続けています。

KDA / IPA を セグメント別に回し直す と、「全体では見えなかった、セグメントごとの異なるドライバー」が見えてきます。セグメンテーションは分析三部作（要因特定 → 優先度 → 顧客分類）の最後のピースです。

2. 事前分類 vs 事後分類 — 2つのアプローチ

顧客の分け方には、根本的に異なる2つのアプローチがあります。混同すると分析の設計を間違えます。

事前分類（A priori / Descriptor-based）

分析者が あらかじめ決めた基準 で機械的に分ける方法です。「年代別」「契約プラン別」「利用頻度別」など。基準が明確で、運用が楽で、誰でも再現できます。

弱点は、その基準が本当に顧客行動を分けているとは限らない こと。「20代と30代で分けたが、実は両者の購買行動はほぼ同じだった」というのはよくあります。分けた気になるだけで、施策が変わらない。

事後分類（Post-hoc / Cluster-based）

アンケートの回答パターン（満足度・ニーズ・価値観など）から、データドリブンに「自然な塊」を発見 する方法です。クラスター分析や潜在クラス分析を使います。「データに語らせる」アプローチで、事前の思い込みでは気づけないセグメントが出てきます。

弱点は、毎回違う結果が出やすく、解釈が難しく、運用で再現しにくい こと。「このセグメントは何者なのか」を解釈する力が要ります。

使い分けの原則

まず事前分類で当たりをつける: デモグラ・行動データで分けて、KDA/IPA に差が出るか見る
差が出ない、または深掘りしたいなら事後分類: クラスター分析でニーズ・価値観ベースの塊を探す
実務では両者を組み合わせる: 事後分類で見つけた塊を、事前分類の変数（年代・プラン）で「プロファイリング」して正体を掴む（第6章）

3. セグメント軸の選び方 — 4種類の変数

何を基準に分けるか。セグメンテーション変数は大きく4種類あり、「分けやすさ」と「打ち手への繋がりやすさ」がトレードオフ になります。

セグメンテーション変数の4種類

デモグラフィック（人口統計）

年齢・性別・年収・地域・職業など。取得が容易で記述しやすいが、行動を説明する力は弱い。「30代女性」が全員同じ買い方をするわけではない。単独では弱く、他軸の補助に向く。

行動（ビヘイビアル）

利用頻度・購入金額・利用機能・継続期間など。実際の行動に基づくため施策に繋げやすい。RFM 分析（最終購入・頻度・金額）が代表。CRM データと結合しやすい。

ニーズ・ベネフィット（求める価値）

「何を重視して選ぶか」。価格重視・品質重視・サポート重視など。製品開発・訴求に最も直結するが、アンケートで丁寧に聞く設計が必要。事後分類の主役。

サイコグラフィック（価値観・ライフスタイル）

性格・価値観・ライフスタイル・態度。深い動機を捉えられるが、測定が難しく解釈に主観が入りやすい。単独運用は上級者向け。

実務の定石

行動 + ニーズの組み合わせ が、最も「使える」セグメントを生みやすい
デモグラは分類軸ではなく、プロファイリング軸として使う（後から「このセグメントは30代が多い」と記述する）
ニーズ・ベネフィットを測るには、リッカート尺度の設問設計が鍵。リッカート尺度の設計ガイドを参照

4. クラスター分析の手法 — 階層・k-means・潜在クラス

事後分類の中核がクラスター分析です。代表的な3手法には、それぞれ適した場面があります。

階層的クラスター分析（Hierarchical）

サンプルを1つずつ併合していき、樹形図（デンドログラム）で塊の構造を見る方法です。セグメント数を事前に決めなくてよく、構造を視覚的に把握できる のが利点。ウォード法（Ward's method）がよく使われます。弱点は計算量が大きく、サンプルが数千を超えると重い こと。小〜中規模サンプルや、探索段階に向きます。

k-means 法

セグメント数 k を 先に指定 し、各点を最も近い重心に割り当てて重心を更新、を繰り返す方法です。大規模データでも高速 で、最も広く使われます。弱点は (1) k を事前に決める必要がある、(2) 初期値依存で結果がブレる（複数回実行して安定性を確認）、(3) 変数のスケールに敏感（必ず標準化してから投入）。

潜在クラス分析（Latent Class Analysis, LCA）

「各回答者は、確率的にいずれかの潜在クラスに属する」と仮定する統計モデルです。Kamakura & Russell (1989) 以来マーケティングで発展しました。統計的な基準（BIC など）でセグメント数を選べる こと、カテゴリ変数を自然に扱えることが利点。弱点は専門性が高く、専用ソフト（Latent GOLD, R の poLCA 等）が要ること。

前処理: 因子分析で次元を圧縮する

設問が 20 問・30 問とある場合、そのままクラスター分析に投入すると、相関し合う設問が同じ概念を二重に重みづけ してしまいます。先に 因子分析（factor analysis） で「価格志向」「品質志向」などの因子に圧縮してから、因子得点でクラスタリングするのが定石です。アンケートの信頼性と妥当性ガイドで因子分析と構成概念の関係を扱っています。

5. セグメント数をどう決めるか — 統計指標と解釈可能性

「いくつに分けるか」はセグメンテーション最大の悩みどころです。統計的指標と、ビジネス上の解釈可能性の両方 で決めます。

統計的な目安

エルボー法（Elbow Method）: クラスター数を増やしたときの「群内平方和の減り方」が緩やかになる「肘」の点を選ぶ
シルエット係数（Silhouette）: 各点が自分の所属クラスターにどれだけ適合し、隣のクラスターからどれだけ離れているかを -1〜1 で評価。Rousseeuw (1987) の指標で、1 に近いほど良い
潜在クラス分析なら BIC / AIC: 情報量規準が最小のクラスター数を選ぶ

しかし最終決定は「解釈可能性」

統計指標が「6セグメントが最適」と出ても、6つを言葉で説明できなければ意味がありません。実務では 3〜6セグメント に落ち着くことが多い。理由は単純で、7つ以上は施策を打ち分けられない（組織のリソースが足りない）からです。

「統計的には最適でも、ビジネスで動かせないセグメント数は採用しない」。これがセグメント数決定の鉄則です。統計はあくまで候補の提示で、最終判断は「このセグメントごとに別の打ち手を打てるか」です。

6. プロファイリングとペルソナ化 — 使えるセグメントの6条件

クラスターが出たら、それぞれが「何者か」を記述（プロファイリング） します。各セグメントについて、デモグラ・行動・ニーズの平均値を出し、「このセグメントは価格重視で30代が多く、利用頻度が低い新規層」のように言語化し、必要ならペルソナに仕立てます。

ただし、統計的に分かれた塊が、すべて「使えるセグメント」とは限りません。Kotler が整理した、実務で使えるセグメントの条件を満たすかを確認します。

測定可能（Measurable）: セグメントの規模・特性を測定できる
接近可能（Accessible）: そのセグメントに広告・営業で到達できる
十分な規模（Substantial）: 投資に見合う大きさがある（1%のセグメントに専用施策は打てない）
差別化可能（Differentiable）: 他セグメントと反応が明確に違う
実行可能（Actionable）: そのセグメント向けに具体的な施策を設計・実行できる
安定的（Stable）: 短期間で消えない、時間的に安定したセグメントである

「統計的にきれいに分かれたが、到達手段がなく、規模も小さい」セグメントは、分析としては正しくてもビジネスでは使えません。プロファイリングの段階で、この6条件で篩にかけます。

7. 編集部の視点 — セグメンテーションでやってはいけない5つ

業界事例と実務担当者の声を継続的に追っている立場から、セグメンテーションで繰り返し起きる事故を5つ。

1. 変数を標準化せずにクラスタリングする

最頻出かつ最も気づかれない事故です。「年収（万円単位、数百〜数千）」と「満足度（1〜5）」を標準化せず k-means に投入すると、スケールの大きい年収だけで塊が決まり、満足度はほぼ無視されます。クラスタリング前に 全変数を標準化（z スコア化） する。これを忘れた分析は、ほぼ確実に間違っています。

2. デモグラだけで分けて「分けた気」になる

「20代/30代/40代で分けました」で終わる。年代で分けても購買行動が同じなら、それは セグメンテーションではなく単なる集計 です。デモグラは分類軸ではなくプロファイリング軸。行動・ニーズで分けて、デモグラで記述する 順番を守る。

3. セグメント数を統計指標だけで決める

シルエット係数が最大だからと8セグメントを採用し、組織が打ち分けられず放置される。「打ち分けられる数」を上限に、統計はその範囲内で最適を選ぶ。3〜6が現実的な着地点です。

4. 一度作ったセグメントを永久に使い続ける

2年前に作ったセグメントを、市場が変わった今も使い続ける。セグメントは 生もの です。市場・顧客・製品が変われば塊も変わる。定期的に（年1回程度）クラスタリングをやり直し、セグメントの安定性（条件6）を確認する。

5. サンプルサイズが小さいのにセグメントを切る

N=150 を6セグメントに割ると、1セグメント平均25人。セグメント別のスコアが誤差だらけ になり、「セグメントAの満足度が高い」と言っても N=20 では意味がない。セグメンテーションを前提にするなら、1セグメント最低 50〜100、できれば各 100 以上 を確保できるサンプル設計を。必要サンプルサイズの決め方を参照。

8. アンケートツール Kicue での顧客セグメンテーション調査

セグメンテーション調査は「分類のもとになる設問を測る」フェーズと「クラスター分析で塊を見つける」分析フェーズに分かれます。Kicue が担うのは前者で、後者は外部の統計ツールとの組み合わせになります。

分類変数の測定: ニーズ・価値観・行動を測るリッカート尺度／単一・複数回答の設問設計に対応（設問タイプ）
デモグラ・行動設問の併設: プロファイリングに使う属性（年代・プラン・利用頻度）を同一フォームで取得
回答者 ID 付き CSV エクスポート: 1 行 1 回答で全設問を並べた、クラスター分析にそのまま投入できる構造で出力。分析後に「どの回答者がどのセグメントか」を CRM と結合し直すことも可能
GT 集計・クロス集計: 事前分類（年代別など）のクロス集計まではダッシュボード上で可能

⚠️ Kicue で対応できない範囲

クラスター分析・k-means・階層クラスター・潜在クラス分析の機能はなし: 統計解析は R（cluster, poLCA 等）/ Python（scikit-learn）/ SPSS / Latent GOLD で実施。Kicue 自体には統計解析機能を持たせていません
因子分析・変数の標準化もなし: クラスタリング前処理はエクスポート後の統計ソフト側で実施
セグメント別のドライバー分析（KDA）もなし: CSV を外部ツールに渡してセグメント別に回す運用
ペルソナの自動生成もなし: プロファイリング結果からのペルソナ化は人手 + BI ツールで実施

関連記事としてキードライバー分析ガイド・重要度-満足度分析（IPA）ガイド・アンケートサンプリング手法ガイド・スクリーニング設問の設計と運用ガイド・アンケートの信頼性と妥当性ガイドを併読すると、「設計 → 分類 → セグメント別の要因分析 → 優先順位」の分析パイプライン全体が見えてきます。

まとめ — 顧客セグメンテーションを使える分析にする6点

全体平均の罠を意識する — KDA/IPA をセグメント別に回し直すと、隠れた違いが見える
行動・ニーズで分け、デモグラで記述する — デモグラ単独分類は「分けた気」で終わる
クラスタリング前に必ず標準化 — スケールの大きい変数に塊を乗っ取られない
セグメント数は「打ち分けられる数」が上限 — 統計指標はその範囲内で最適を選ぶ（3〜6が現実解）
6条件（測定・接近・規模・差別化・実行・安定）で篩にかける — 統計的な塊 ≠ 使えるセグメント
セグメント前提なら各 100 以上を確保 — 小サンプルを細切れにすると誤差だらけ

顧客セグメンテーションは「高度なクラスター分析を回すこと」が目的ではありません。標準化・解釈可能性・実行可能性の3点を外さないこと で、「平均的な顧客」という幻想から抜け出し、塊ごとに刺さる打ち手を設計できる、戦略の土台になる分析です。

セグメンテーションのもとになる調査を設計したい方は、無料のアンケートツール Kicue を試してみませんか。ニーズ・行動・属性を測るリッカート／選択設問の設計、回答者 ID 付き CSV エクスポートで、クラスター分析の入力データを作る部分を 1 アカウントで開始できます（クラスター分析・因子分析・潜在クラス分析・変数の標準化は R / Python / SPSS / Latent GOLD との組み合わせ運用となります）。

参考文献 (5件)

Smith, W. R. (1956). Product Differentiation and Market Segmentation as Alternative Marketing Strategies. Journal of Marketing, 21(1), 3-8.
Punj, G., & Stewart, D. W. (1983). Cluster Analysis in Marketing Research: Review and Suggestions for Application. Journal of Marketing Research, 20(2), 134-148.
Kamakura, W. A., & Russell, G. J. (1989). A Probabilistic Choice Model for Market Segmentation and Elasticity Structure. Journal of Marketing Research, 26(4), 379-390.
Rousseeuw, P. J. (1987). Silhouettes: A graphical aid to the interpretation and validation of cluster analysis. Journal of Computational and Applied Mathematics, 20, 53-65.
Wedel, M., & Kamakura, W. A. (2000). Market Segmentation: Conceptual and Methodological Foundations (2nd ed.). Kluwer Academic Publishers.