ノウハウ

CX メトリクス使い分けガイド — NPS / CSAT / CES のいつどれを使うか

NPS・CSAT・CESの3大CXメトリクス。それぞれが測る構成概念、適切な使い分け、企業フェーズ別の選択基準、よくある間違いを、Reichheld (2003)・Dixon et al. (2010) 等の原典に基づいて整理する。

「NPS、CSAT、CES——どれを使えばいいんですか?」——CX や CS の領域に入った人なら必ず一度は迷う問いです。3 つとも「顧客の声を数値化する」指標なのに、それぞれ測っているものが微妙に違う。ところが多くの現場では、違いを明確にしないまま「とりあえず NPS を取ろう」「CSAT も並走で」と並走させて、結局どちらも経営判断に使えない数字 が積み上がっていきます。

本稿では、3 つのメトリクスが何を測っているか、いつどれを使うか、企業フェーズ別の選択基準、よくある 3 つの間違い、そして編集部の実践指針 を、Reichheld (2003) NPS 原典・Dixon et al. (2010) CES 原典・学術的批判文献を踏まえて整理します。既存の NPSCSATCES の個別記事を 「横断的に使い分けるための hub」 として位置づけた一本です。

1. なぜ「メトリクス選び」で失敗するのか

CX メトリクス導入で最も多い失敗パターンは、「全部やる」決定です。

  • 「NPS を取ろう」 → 経営会議で報告するため
  • 「CSAT も並走で」 → サポート品質を見たいから
  • 「CES もやろう」 → Gartner が良いって言ってたから

結果、全社で 3 つのメトリクスがバラバラに収集され、誰もどれを軸に何を改善すべきか分からなくなる。これは「KPI の希薄化」と呼ばれる典型的な失敗で、Hayes (2008) Measuring Customer Satisfaction and Loyalty も「メトリクスの数が増えるほど、組織の改善活動は遅くなる」と指摘しています。

メトリクスを「何のために、どのタッチポイントで、誰の意思決定に使うか」を決めないまま並走させると、3 つの数字がただ並ぶダッシュボード ができあがります。

2. 3 つのメトリクスは何を測っているか

3 指標の違いは、測っている「構成概念(construct)」 の違いです。

NPS(Net Promoter Score)— ロイヤルティ・推奨度

Reichheld, F. F. (2003) The One Number You Need to Grow (HBR) が提唱。「この企業を友人や同僚に推奨する可能性はどれくらいですか? 0〜10 で」という 1 問 で測る。

  • 構成概念: ロイヤルティ / 推奨意向
  • 出力: -100 〜 +100 のスコア(推奨者 % − 批判者 %)
  • 強み: 経年比較が容易、経営層への報告がシンプル
  • 弱み: 計算方法への学術的批判が蓄積(Keiningham et al. 2007)

CSAT(Customer Satisfaction Score)— 取引・体験の満足度

起源は単一の論文ではなく、Oliver (1980) A Cognitive Model of the Antecedents and Consequences of Satisfaction Decisions に遡る期待不一致理論をベースに、1980〜90 年代に広く普及。「今回の◯◯にどの程度満足しましたか? 1〜5 で」で測る。

  • 構成概念: 満足度(期待と実際の差)
  • 出力: 平均値(例: 4.2 / 5.0)または満足者率(4 点以上 / 全回答)
  • 強み: タッチポイント直後の体験を即座に測れる
  • 弱み: 文化差・尺度差で経年比較が難しい

CES(Customer Effort Score)— 摩擦・労力

Dixon, M., Freeman, K., & Toman, N. (2010) Stop Trying to Delight Your Customers (HBR) が提唱。75,000 人規模の調査をもとに「顧客を感動させるな。手間を減らせ」と主張。「この問題の解決にどれくらい手間がかかりましたか? 1(非常に少ない)〜7(非常に多い)」で測る。

  • 構成概念: 顧客の労力(effort)= 摩擦
  • 出力: 平均値または「労力が少なかった(5 以上)」回答率
  • 強み: サポートの離脱予防に直結(高 CES = 離反予兆)
  • 弱み: 関係性全体の評価には向かない

つまり 3 つは「別物」を測っている

指標測る対象測るタイミング主な利用部門
NPSロイヤルティ・推奨意向関係性測定(年 1〜4 回)経営層・マーケ
CSAT取引・体験への満足タッチポイント直後CS・プロダクト
CES課題解決時の労力サポート対応直後サポート・カスタマーサクセス

「どれが優れているか」ではなく、「どの意思決定にどの指標が答えるか」 で選びます。

3. いつどれを使うか — タッチポイント別の選択

関係性測定 → NPS

四半期 / 半期 / 年次で「自社全体の評価」を定点観測したいなら、NPS が第一選択。1 問で済むので回答負荷が低く、経年比較に向く。経営会議で「自社の顧客ロイヤルティは前年比で改善したか」を語る指標として最も使われている理由はここにあります。

ただし、NPS だけで業績を予測できるという主張には学術的批判が多い(NPS 記事 で詳述)。NPS の数字は「方向感」として使い、業績予測には別データと組み合わせる のが現実的です。

取引測定 → CSAT

「先週のオンボーディング体験はどうだったか」「今回の購入はスムーズだったか」など、特定のタッチポイント直後の評価 には CSAT が向く。NPS で関係性全体を見て、CSAT で各タッチポイントを掘る、という構造が一般的です。

CSAT は 5 段階リッカート が主流(リッカート尺度の設計 を参照)。質問文の wording 次第でスコアが 10〜20% 動くので、運用は wording の固定が必須です。

個別タッチポイントの摩擦測定 → CES

「サポートチケット解決後」「申し込みフロー完了直後」など、摩擦が起きやすいタッチポイント には CES が威力を発揮。高 CES(手間がかかった)の顧客は 次の更新で 4 倍離反しやすい という Dixon et al. (2010) の知見が、CES を CS 部門の必須指標に押し上げました。

CES は 「全タッチポイント」で取るのではなく、摩擦リスクの高い 1〜2 ポイントに絞る のが定石。全部に貼ると回答負荷が上がり、本来狙うべきタッチポイントの数字が薄まります。

4. 企業フェーズ別の優先度

「全部やる」が失敗するなら、フェーズで優先度を変える のが現実解です。

スタートアップ初期(PMF 前)

  • 第一優先: CSAT — 体験の即時改善を最優先。NPS は N が小さすぎて意味のあるスコアにならない。CES もまだサポート組織が小さい段階では過剰。
  • 取り方: オンボーディング完了直後 + 初回購入後の 2 ポイントで CSAT を 5 段階で取る。

PMF 後・成長期

  • 第一優先: NPS — 口コミと再購入の予測指標として価値が出てくる。
  • 第二優先: CSAT — 主要タッチポイント 3〜5 個で並走。
  • 取り方: NPS は四半期 1 回、CSAT はタッチポイント直後で常時。

成熟期 / エンタープライズ

  • NPS + CSAT + CES の三層構造 が機能する。
  • NPS: 経営報告(年 2〜4 回)。
  • CSAT: プロダクト改善(タッチポイント別、常時)。
  • CES: サポート / サクセス組織(個別チケット、常時)。
  • 重要: ダッシュボードで混ぜず、役割を分けたまま個別に運用 する。

「並走する」と「混ぜる」は別物です。役割を分けたまま並走するのは正解、ダッシュボードに 3 つ並べて平均を取るのは間違い。

5. よくある 3 つの間違い

間違い 1: NPS だけで業績を予測する

「NPS が上がれば売上が上がる」と信じきって、他のリーディング指標(CSAT・CES・解約率・拡張率)を見なくなる。これは NPS の最大の誤用です。Keiningham et al. (2007) A Longitudinal Examination of Net Promoter and Firm Revenue Growth は、NPS 単体では業績との因果関係が弱い ことを実証しました。

NPS は「方向感」を示す。業績予測には NPS + 解約率 + 拡張率 + コホート別 LTV など複数を組み合わせる。

間違い 2: 3 指標を全部取って改善しない

「NPS も CSAT も CES も取りました」 → 「数字は見ています」 → 「で、何を改善した?」が答えられない

メトリクスを取る目的は「数字を持つこと」ではなく「改善を起こすこと」。3 指標を並走させるなら、それぞれの所有者(owner)と改善 PDCA を分ける のが必須です。所有者が同じだと、結局どれか 1 つの数字だけを追って残りは捨てられます。

間違い 3: ダッシュボードで平均化する

「NPS = 30 / CSAT = 4.2 / CES = 5.5 → 全体 CX スコア = 75」のような メトリクス平均化 は、構成概念が違うものを足し合わせるので 意味のない数字 を生みます。

混ぜずに 3 つの数字を別々のグラフで見て、それぞれ独立に改善する のが定石。経営層への報告では、「ロイヤルティ(NPS)は改善、満足度(CSAT)は横ばい、摩擦(CES)は悪化」のように 3 つの異なるストーリーを語る のが正しい。

6. 編集部の視点 — 5 つの実践指針

業界文献と現場運用を踏まえ、編集部が必ず守る 5 項目。

1. メトリクス選択の意思決定基準を「タッチポイント × 役割」で書き出す。 「経営報告に何が要るか」「プロダクト改善に何が要るか」「サポート改善に何が要るか」を先に書く。3 つの問いに同じ指標が並んだら警戒する。経営報告と CS 改善で 同じ NPS を使い回すのは典型的な失敗

2. メトリクスを増やすときは「捨てる指標」を明示する。 新しい指標を入れるたびに、既存の何を捨てるか を必ず議論する。捨てないとダッシュボードが膨らみ、誰も見なくなる。Hayes (2008) も「メトリクスは追加より削減の方が組織への効果が大きい」と書いています。

3. NPS / CSAT / CES の質問 wording は固定する。 3 指標とも wording 1 文字違えばスコアが動く。導入時に wording を確定したら、最低 2 年間は変えない。経年比較を可能にすることが、メトリクス運用の最大の価値です。wording 設計の落とし穴は 設問wording の落とし穴 で詳述。

4. サンプル数の最低基準を決める。 NPS は N=200 未満では信頼区間が ±10pt 以上 ぶれます。CSAT / CES も同様。「N=50 で出た NPS が前回から +5 動いた」は誤差の範囲です。サンプル数の決め方 を参照して、意思決定に使うなら N=200 以上 を目安にする。

5. 「指標を取る」で止めず、改善 PDCA まで設計する。 各指標に「閾値超え時のアラート → 担当部門への振り分け → 改善アクション → 次回測定で検証」のループを 数値設計時点で書く。これをやらない指標は、3 ヶ月後にダッシュボードの飾りになります。

7. アンケートツール Kicue で 3 指標を運用するには

Kicue は NPS・CSAT・CES の 3 指標をすべて 1 ファイル / 30 秒で生成 できます。

NPS の実装

スケール設問11 段階(0〜10) で設定。Markdown / Excel テンプレートに「あなたは Kicue を友人や同僚に推奨しますか? 0〜10」を 1 問書くだけ。

CSAT の実装

スケール設問 または SA(単一選択)5 段階リッカート で設定。質問文の wording は、リッカート尺度の設計 で示した「期待との差」を明示するパターンを推奨。

CES の実装

スケール設問7 段階(1〜7) で設定。Dixon et al. (2010) 原典の wording 「The company made it easy for me to handle my issue(この会社は私の問題への対応をどれくらい容易にしてくれましたか)」が業界標準。

タッチポイント別の配信

URL パラメータ で「どのタッチポイント由来の回答か」を識別。NPS(関係性)と CSAT(取引)と CES(サポート)を 1 つのアカウントで運用しつつ、ダッシュボードでは別グラフに分けるのが推奨運用です。

集計と離反予兆の検出

ローデータエクスポート で NPS・CSAT・CES のスコアをタッチポイント別にダウンロード。高 CES(5 点以上)の顧客リストを CRM 連携でフラグ化すれば、Dixon et al. (2010) の知見通り 離反予兆検出 に使えます。

他ツールで CX メトリクス三層運用する場合の比較

NPS(11段階)/ CSAT(5段階)/ CES(7段階)を 1 ツールで運用するには、スケール設問の柔軟性 + URL パラメータでのタッチポイント識別 + CSV エクスポート の 3 要素が揃っている必要があります。無料プランでこの 3 要素が揃うツールは限られるので、各ツールの対応状況は 無料アンケートツール 8 選比較 を参照してください。

まとめ

CX メトリクス選択のチェックリスト:

  1. NPS / CSAT / CES は別の構成概念を測る — ロイヤルティ / 満足 / 労力。混ぜない。
  2. 3 つとも取ると失敗する — 「全部やる」は KPI の希薄化を生む。
  3. タッチポイント × 役割で使い分ける — 関係性は NPS、取引は CSAT、摩擦は CES。
  4. 企業フェーズで優先度を変える — 初期は CSAT、成長期は NPS+CSAT、成熟期は三層。
  5. よくある間違い 3 つ: NPS だけで業績予測 / 全指標並走で改善しない / 平均化ダッシュボード。
  6. 編集部視点 5 項目: タッチポイント×役割で書き出す / 増やすなら捨てる / wording 固定 / N=200 以上 / 改善 PDCA まで設計。
  7. Kicue は 3 指標すべてを 1 ファイル / 30 秒で生成可能、URL パラメータでタッチポイント識別、ローデータエクスポートで離反予兆検出。

CX メトリクスは「持っている数字の数」ではなく「改善に使われている数字の数」で評価するのが、現代の CX 運用の標準姿勢です。本稿の各個別記事(NPS / CSAT / CES)と組み合わせて、まず 「自社で意思決定に使うメトリクスは 1〜2 個に絞る」 ところから始めてください。


参考文献 (11件)

学術・方法論

標準化団体・方法論センター

業界ガイド(業界観察として参照)


CX メトリクス(NPS / CSAT / CES)を 30 秒で配信したい方は、無料のアンケートツール Kicue を試してみませんか。3 指標すべてをスケール設問で実装でき、URL パラメータでタッチポイント識別、ローデータエクスポートで離反予兆検出までを 1 アカウントで運用できます。

関連記事

Kicue でアンケートを作ってみませんか?

調査票をアップロードするだけで、AIが30秒でWebアンケートを自動生成します。

無料で始める