ノウハウ

顧客セグメンテーション調査 — クラスター分析で顧客を分ける

アンケートデータから顧客を意味のあるセグメントに分類する顧客セグメンテーション調査の設計を解説。事前分類と事後分類(クラスター分析)の違い、デモグラ・行動・ニーズ・サイコグラフィックの4つの分類軸、階層クラスター・k-means・潜在クラス分析の使い分け、セグメント数の決め方、使えるセグメントの6条件まで、Smith (1956) 以来のセグメンテーション研究と実務の勘所で整理する。

キードライバー分析で「総合満足度を動かすのはサポートだ」と分かった。重要度-満足度分析で「重点改善はサポートと価格だ」と決まった。でも、その結論には 隠れた前提 があります。「顧客は1つの塊だ」 という前提です。

実際には、価格にシビアな新規顧客と、機能の深さを求めるヘビーユーザーでは、満足度を動かす要因がまるで違う。全体平均で「サポートが効く」と出ても、それは2つの異なる顧客群を混ぜて均した結果で、どちらの顧客にとっても正確ではない ——統計学でいう「平均的な顧客は実在しない」問題です。これを解くのが 顧客セグメンテーション調査 です。アンケートデータから「似た者同士の塊」を見つけ、塊ごとに戦略を変える。本稿では、分類の2大アプローチから、分類軸の選び方、クラスター分析の手法、セグメント数の決め方、そして「使えるセグメントの条件」までを、実務の手触りで整理します。

1. なぜセグメンテーションか — 全体平均という罠

キードライバー分析重要度-満足度分析(IPA) も、強力ですが 「回答者全体を1つの母集団として平均する」 点が共通の弱点です。

異質な顧客を混ぜて平均すると、シンプソンのパラドックス に近い現象が起きます。「全体ではサポートが満足度の最大ドライバー」でも、セグメントAでは価格が、セグメントBでは機能が最大ドライバー、というのは日常茶飯事です。全体平均だけで意思決定すると、どのセグメントにも刺さらない、平均的で凡庸な施策 に投資してしまう。

セグメンテーションの目的は単純です。「似た反応をする顧客の塊」に分けて、塊ごとに最適な打ち手を変える。マーケティングの古典 Smith (1956) が「製品差別化」と対比して「市場細分化」を提唱して以来、セグメンテーションはマーケティング戦略の土台であり続けています。

KDA / IPA を セグメント別に回し直す と、「全体では見えなかった、セグメントごとの異なるドライバー」が見えてきます。セグメンテーションは分析三部作(要因特定 → 優先度 → 顧客分類)の最後のピースです。

2. 事前分類 vs 事後分類 — 2つのアプローチ

顧客の分け方には、根本的に異なる2つのアプローチがあります。混同すると分析の設計を間違えます。

事前分類(A priori / Descriptor-based)

分析者が あらかじめ決めた基準 で機械的に分ける方法です。「年代別」「契約プラン別」「利用頻度別」など。基準が明確で、運用が楽で、誰でも再現できます。

弱点は、その基準が本当に顧客行動を分けているとは限らない こと。「20代と30代で分けたが、実は両者の購買行動はほぼ同じだった」というのはよくあります。分けた気になるだけで、施策が変わらない。

事後分類(Post-hoc / Cluster-based)

アンケートの回答パターン(満足度・ニーズ・価値観など)から、データドリブンに「自然な塊」を発見 する方法です。クラスター分析や潜在クラス分析を使います。「データに語らせる」アプローチで、事前の思い込みでは気づけないセグメントが出てきます。

弱点は、毎回違う結果が出やすく、解釈が難しく、運用で再現しにくい こと。「このセグメントは何者なのか」を解釈する力が要ります。

使い分けの原則

  • まず事前分類で当たりをつける: デモグラ・行動データで分けて、KDA/IPA に差が出るか見る
  • 差が出ない、または深掘りしたいなら事後分類: クラスター分析でニーズ・価値観ベースの塊を探す
  • 実務では両者を組み合わせる: 事後分類で見つけた塊を、事前分類の変数(年代・プラン)で「プロファイリング」して正体を掴む(第6章)

3. セグメント軸の選び方 — 4種類の変数

何を基準に分けるか。セグメンテーション変数は大きく4種類あり、「分けやすさ」と「打ち手への繋がりやすさ」がトレードオフ になります。

セグメンテーション変数の4種類

デモグラフィック(人口統計)
年齢・性別・年収・地域・職業など。取得が容易で記述しやすいが、行動を説明する力は弱い。「30代女性」が全員同じ買い方をするわけではない。単独では弱く、他軸の補助に向く。
行動(ビヘイビアル)
利用頻度・購入金額・利用機能・継続期間など。実際の行動に基づくため施策に繋げやすい。RFM 分析(最終購入・頻度・金額)が代表。CRM データと結合しやすい。
ニーズ・ベネフィット(求める価値)
「何を重視して選ぶか」。価格重視・品質重視・サポート重視など。製品開発・訴求に最も直結するが、アンケートで丁寧に聞く設計が必要。事後分類の主役。
サイコグラフィック(価値観・ライフスタイル)
性格・価値観・ライフスタイル・態度。深い動機を捉えられるが、測定が難しく解釈に主観が入りやすい。単独運用は上級者向け。

実務の定石

  • 行動 + ニーズの組み合わせ が、最も「使える」セグメントを生みやすい
  • デモグラは分類軸ではなく、プロファイリング軸として使う(後から「このセグメントは30代が多い」と記述する)
  • ニーズ・ベネフィットを測るには、リッカート尺度の設問設計が鍵。リッカート尺度の設計ガイド を参照

4. クラスター分析の手法 — 階層・k-means・潜在クラス

事後分類の中核がクラスター分析です。代表的な3手法には、それぞれ適した場面があります。

階層的クラスター分析(Hierarchical)

サンプルを1つずつ併合していき、樹形図(デンドログラム)で塊の構造を見る方法です。セグメント数を事前に決めなくてよく、構造を視覚的に把握できる のが利点。ウォード法(Ward's method)がよく使われます。弱点は計算量が大きく、サンプルが数千を超えると重い こと。小〜中規模サンプルや、探索段階に向きます。

k-means 法

セグメント数 k を 先に指定 し、各点を最も近い重心に割り当てて重心を更新、を繰り返す方法です。大規模データでも高速 で、最も広く使われます。弱点は (1) k を事前に決める必要がある、(2) 初期値依存で結果がブレる(複数回実行して安定性を確認)、(3) 変数のスケールに敏感(必ず標準化してから投入)。

潜在クラス分析(Latent Class Analysis, LCA)

「各回答者は、確率的にいずれかの潜在クラスに属する」と仮定する統計モデルです。Kamakura & Russell (1989) 以来マーケティングで発展しました。統計的な基準(BIC など)でセグメント数を選べる こと、カテゴリ変数を自然に扱えることが利点。弱点は専門性が高く、専用ソフト(Latent GOLD, R の poLCA 等)が要ること。

前処理: 因子分析で次元を圧縮する

設問が 20 問・30 問とある場合、そのままクラスター分析に投入すると、相関し合う設問が同じ概念を二重に重みづけ してしまいます。先に 因子分析(factor analysis) で「価格志向」「品質志向」などの因子に圧縮してから、因子得点でクラスタリングするのが定石です。アンケートの信頼性と妥当性ガイド で因子分析と構成概念の関係を扱っています。

5. セグメント数をどう決めるか — 統計指標と解釈可能性

「いくつに分けるか」はセグメンテーション最大の悩みどころです。統計的指標と、ビジネス上の解釈可能性の両方 で決めます。

統計的な目安

  • エルボー法(Elbow Method): クラスター数を増やしたときの「群内平方和の減り方」が緩やかになる「肘」の点を選ぶ
  • シルエット係数(Silhouette): 各点が自分の所属クラスターにどれだけ適合し、隣のクラスターからどれだけ離れているかを -1〜1 で評価。Rousseeuw (1987) の指標で、1 に近いほど良い
  • 潜在クラス分析なら BIC / AIC: 情報量規準が最小のクラスター数を選ぶ

しかし最終決定は「解釈可能性」

統計指標が「6セグメントが最適」と出ても、6つを言葉で説明できなければ意味がありません。実務では 3〜6セグメント に落ち着くことが多い。理由は単純で、7つ以上は施策を打ち分けられない(組織のリソースが足りない)からです。

「統計的には最適でも、ビジネスで動かせないセグメント数は採用しない」。これがセグメント数決定の鉄則です。統計はあくまで候補の提示で、最終判断は「このセグメントごとに別の打ち手を打てるか」です。

6. プロファイリングとペルソナ化 — 使えるセグメントの6条件

クラスターが出たら、それぞれが「何者か」を記述(プロファイリング) します。各セグメントについて、デモグラ・行動・ニーズの平均値を出し、「このセグメントは価格重視で30代が多く、利用頻度が低い新規層」のように言語化し、必要ならペルソナに仕立てます。

ただし、統計的に分かれた塊が、すべて「使えるセグメント」とは限りません。Kotler が整理した、実務で使えるセグメントの条件を満たすかを確認します。

  • 測定可能(Measurable): セグメントの規模・特性を測定できる
  • 接近可能(Accessible): そのセグメントに広告・営業で到達できる
  • 十分な規模(Substantial): 投資に見合う大きさがある(1%のセグメントに専用施策は打てない)
  • 差別化可能(Differentiable): 他セグメントと反応が明確に違う
  • 実行可能(Actionable): そのセグメント向けに具体的な施策を設計・実行できる
  • 安定的(Stable): 短期間で消えない、時間的に安定したセグメントである

「統計的にきれいに分かれたが、到達手段がなく、規模も小さい」セグメントは、分析としては正しくてもビジネスでは使えません。プロファイリングの段階で、この6条件で篩にかけます。

7. 編集部の視点 — セグメンテーションでやってはいけない5つ

業界事例と実務担当者の声を継続的に追っている立場から、セグメンテーションで繰り返し起きる事故を5つ。

1. 変数を標準化せずにクラスタリングする

最頻出かつ最も気づかれない事故です。「年収(万円単位、数百〜数千)」と「満足度(1〜5)」を標準化せず k-means に投入すると、スケールの大きい年収だけで塊が決まり、満足度はほぼ無視されます。クラスタリング前に 全変数を標準化(z スコア化) する。これを忘れた分析は、ほぼ確実に間違っています。

2. デモグラだけで分けて「分けた気」になる

「20代/30代/40代で分けました」で終わる。年代で分けても購買行動が同じなら、それは セグメンテーションではなく単なる集計 です。デモグラは分類軸ではなくプロファイリング軸。行動・ニーズで分けて、デモグラで記述する 順番を守る。

3. セグメント数を統計指標だけで決める

シルエット係数が最大だからと8セグメントを採用し、組織が打ち分けられず放置される。「打ち分けられる数」を上限に、統計はその範囲内で最適を選ぶ。3〜6が現実的な着地点です。

4. 一度作ったセグメントを永久に使い続ける

2年前に作ったセグメントを、市場が変わった今も使い続ける。セグメントは 生もの です。市場・顧客・製品が変われば塊も変わる。定期的に(年1回程度)クラスタリングをやり直し、セグメントの安定性(条件6)を確認する。

5. サンプルサイズが小さいのにセグメントを切る

N=150 を6セグメントに割ると、1セグメント平均25人。セグメント別のスコアが誤差だらけ になり、「セグメントAの満足度が高い」と言っても N=20 では意味がない。セグメンテーションを前提にするなら、1セグメント最低 50〜100、できれば各 100 以上 を確保できるサンプル設計を。必要サンプルサイズの決め方 を参照。

8. アンケートツール Kicue での顧客セグメンテーション調査

セグメンテーション調査は「分類のもとになる設問を測る」フェーズと「クラスター分析で塊を見つける」分析フェーズに分かれます。Kicue が担うのは前者で、後者は外部の統計ツールとの組み合わせになります。

  • 分類変数の測定: ニーズ・価値観・行動を測るリッカート尺度/単一・複数回答の設問設計に対応(設問タイプ
  • デモグラ・行動設問の併設: プロファイリングに使う属性(年代・プラン・利用頻度)を同一フォームで取得
  • 回答者 ID 付き CSV エクスポート: 1 行 1 回答で全設問を並べた、クラスター分析にそのまま投入できる構造で出力。分析後に「どの回答者がどのセグメントか」を CRM と結合し直すことも可能
  • GT 集計・クロス集計: 事前分類(年代別など)のクロス集計まではダッシュボード上で可能

⚠️ Kicue で対応できない範囲

  • クラスター分析・k-means・階層クラスター・潜在クラス分析の機能はなし: 統計解析は R(cluster, poLCA 等)/ Python(scikit-learn)/ SPSS / Latent GOLD で実施。Kicue 自体には統計解析機能を持たせていません
  • 因子分析・変数の標準化もなし: クラスタリング前処理はエクスポート後の統計ソフト側で実施
  • セグメント別のドライバー分析(KDA)もなし: CSV を外部ツールに渡してセグメント別に回す運用
  • ペルソナの自動生成もなし: プロファイリング結果からのペルソナ化は人手 + BI ツールで実施

関連記事として キードライバー分析ガイド重要度-満足度分析(IPA)ガイドアンケート サンプリング手法ガイドスクリーニング設問の設計と運用ガイドアンケートの信頼性と妥当性ガイド を併読すると、「設計 → 分類 → セグメント別の要因分析 → 優先順位」の分析パイプライン全体が見えてきます。

まとめ — 顧客セグメンテーションを使える分析にする6点

  1. 全体平均の罠を意識する — KDA/IPA をセグメント別に回し直すと、隠れた違いが見える
  2. 行動・ニーズで分け、デモグラで記述する — デモグラ単独分類は「分けた気」で終わる
  3. クラスタリング前に必ず標準化 — スケールの大きい変数に塊を乗っ取られない
  4. セグメント数は「打ち分けられる数」が上限 — 統計指標はその範囲内で最適を選ぶ(3〜6が現実解)
  5. 6条件(測定・接近・規模・差別化・実行・安定)で篩にかける — 統計的な塊 ≠ 使えるセグメント
  6. セグメント前提なら各 100 以上を確保 — 小サンプルを細切れにすると誤差だらけ

顧客セグメンテーションは「高度なクラスター分析を回すこと」が目的ではありません。標準化・解釈可能性・実行可能性の3点を外さないこと で、「平均的な顧客」という幻想から抜け出し、塊ごとに刺さる打ち手を設計できる、戦略の土台になる分析です。


セグメンテーションのもとになる調査を設計したい方は、無料のアンケートツール Kicue を試してみませんか。ニーズ・行動・属性を測るリッカート/選択設問の設計、回答者 ID 付き CSV エクスポートで、クラスター分析の入力データを作る部分を 1 アカウントで開始できます(クラスター分析・因子分析・潜在クラス分析・変数の標準化は R / Python / SPSS / Latent GOLD との組み合わせ運用となります)。

参考文献 (5件)

関連記事

ノウハウ

キードライバー分析ガイド — 満足度・NPSを動かす要因の特定

キードライバー分析(Key Driver Analysis)で総合満足度・NPSを動かしている要因を特定する手法を解説。相関係数だけで判断する落とし穴、重回帰分析の多重共線性という罠、それを解くShapley値・相対的重み付け(Johnson's Relative Weights)、相関と因果の混同という最大の誤読まで、Johnson (2000) 以来の相対重要度研究と実務の勘所で整理する。IPA(重要度-満足度分析)の導出重要度の出力元としての位置づけも示す。

ノウハウ

コンセプトテスト調査ガイド — 発売前に受容性を測る設計

新商品・新機能・広告コピーを発売前にアンケートで評価するコンセプトテストの設計を解説。モナディック・順次モナディック・比較提示の使い分け、購入意向・新規性・好意度・独自性という標準指標、トップボックスの読み方、ノルム(基準値)比較の重要性、刺激(コンセプト文)の作り込みまで、実務の勘所で整理する。PSM・コンジョイント・MaxDiff の前段に位置づく発売前調査の入口。

ノウハウ

アンケートの設問数は何問が適切か — 離脱を防ぐ長さの決め方

アンケートの設問数は何問が適切か。結論は「5分・15問前後」を目安に、目的から逆算して削ること。設問数が増えると回答率と回答品質が落ちる理由、適切な長さを決める5ステップ、離脱を防ぐ削り方を、Galesic & Bosnjak (2009) などの研究と実務の勘所で解説する。

Kicue でアンケートを作ってみませんか?

調査票をアップロードするだけで、AIが30秒でWebアンケートを自動生成します。

無料で始める