データを集めたら、次にデータを分析しなければなりません。
集めたデータと分析の関係は、食材と料理の関係に似ています。良い食材であっても料理人の腕に問題があると台無しになることがあります。不十分な食材でも調理しだいで美味しくなることもあります。
データの分析の考え方と最も基本的な手法について、全15回にわたってお話しいたします。
- その1 定量分析と定性分析
- その2 分析の基本は比較
- その3 古くて新しいQC7つ道具 ※5回に分けてお話し
- その3-1 QC7つ道具の概要
- その3-2 ヒストグラム・管理図・散布図
- その3-3 散布図+α(相関・回帰線)の話題
- その3-4 パレート図・特性要因図 ⇒ 今回
- その3-5 チェックシート・層別
- その4 古くて新しい新QC7つ道具 ※5回に分けてお話し
- その5 要因分析と統計的因果推論 ※3回に分けてお話し
前回は、その3の「古くて新しいQC7つ道具」のその3-3の「散布図+α(相関・回帰線)の話題」についてお話ししました。
今回は、その3-4の「パレート図・特性要因図」です。
Contents
パレート図とは?
パレート図とは、数値の大きな項目から順番に並べたグラフです。深掘りすべきポイントを把握するために欠かせません。
パレートの法則(80:20の法則)という名で有名で、例えば、売上上位20%商品で全体の売上の80%を占めるという、一部の商品が売り上げの大部分を占めるという現象を説明したものです。
このことから、全体の売上に大きく貢献している商品(つまり売れ筋商品)とそうでない商品がわかります。
どの商品を重点的に扱えばよいのかが分かり、データを分析する上での深堀ポイントも見えてきます。
パレート図の作り方
作り方は簡単で、売上の例で説明します。
- 先ず、商品別に売上を計算し、売上の大きい順に商品を並べます。
- 次に、売上の大きい順に並んだ売上の累積売上を順次計算し、全売上に占める割合を計算します。
実際に「80:20」に近しい値になることはありますが、「70:30」や「90:10」など様々です。
特性要因図(フィッシュボーンチャート)とは?
特性要因図(フィッシュボーンチャート)とは特性(結果)と要因(原因)に分けてその関係を図で表したものです。
魚の骨に似ているのでフィッシュボーンチャート(魚の骨)などと呼ばれています。
深堀すべきポイントを把握するために利用
パレート図と同様に、深堀すべきポイントを把握するために欠かせません。
例えば……
- 先ず、ヒストグラムや管理図、散布図などでデータの特徴を理解
- 次に、パレート図や特性要因図などで深堀すべきポイントを掴む
……ために使用したりします。
パレート図×特性要因図で深掘り分析
深堀すべきポイントを把握するという用途での、パレート図と特性要因図の違いというか使い分け方を、先ほどのあげた例をもとに簡単に説明します。
先ほどのパレート図から、少なくとも商品Aは重点的に扱うべき商品ということが分かります。
なぜならば、売上が最大で、商品Aが売上に占める割合が大きく、全体の売上への影響が大きいからです。そのため、商品Aをより深く分析した方が良いでしょう。
次に、この商品Aの何を分析していけばいいのでしょうか。
例えば、売上(特性)に影響を与える要因を探り、影響の大きな要因に絞っていくと良いでしょう。
売上に影響する要因は色々あるため、その要因を洗い出し整理した上で、どの要因に着目すればいいのかが考えていったほうが良さそうです。そのために、特性要因図を描き、データがあれば売上と各要因の関係性を数値化していきます。
最も簡単な方法は、売上との相関係数を求めることです。もしくは、線形回帰モデル(単回帰モデル・重回帰モデル)などの数理モデルを使うのもいいでしょう。
この場合、深堀すべき(重点的に扱うべき)要因は、売上への影響度の大きい周期性(季節要因など)やテレビCM、メルマガ会員向けキャンペーンなどとなります。このように、通常は複数になります。
数理モデルを設計する手段としての特性要因図
今、特性要因図(フィッシュボーンチャート)の特性と各要因の関係性を数値化するために、線形回帰モデル(単回帰モデル・重回帰モデル)などの数理モデルを使うというお話しをしました。
この数理モデルそのものを設計する手段(数理モデルの図示化)として、特性要因図(フィッシュボーンチャート)を使うことがあります。
この場合、もちろん深堀すべきポイントを把握するという用途ではありません。用途は、異常検知モデルであれば「異常検知」という用途ですし、予測モデルであれば「将来予測」という用途になります。
予測モデルなどの数理モデルの設計時に、特性要因図(フィッシュボーンチャート)を描くことで、どのようなデータが必要なのかが視覚的に分かります
。
そして、「既にあるデータ」と「今はないデータ」をマーキングしたりします。このことで、このデータでモデルを構築したときに考慮していない要因は何で、今後整備すべきデータは何かが分かります。
特性要因図(フィッシュボーンチャート)で数理モデル(予測モデルや異常検知モデルなど)を設計できれば、後はデータを集めモデルを構築するだけです。
構築した数理モデル(予測モデルや異常検知モデルなど)を使い、将来予測をすることもできますし、異常検知をすることもできます。この数理モデル(予測モデルや異常検知モデルなど)を使い、要因分析をすることもできますし、理想的なY(例:目標売上など)になるためのX(例:施策の組み合わせなど)を検討しレコメンドに活用することもできます。
このように、特性要因図(フィッシュボーンチャート)は非常に使い勝手のいいものです。
この特性要因図(フィッシュボーンチャート)を手書きで描くのは大変なので、色々なツールがあります。ツリーのツールもあります。例えば、XMind(http://jp.xmind.net/)というツールです。
次回
今回は、その3の「古くて新しいQC7つ道具」のその3-4の「パレート図・特性要因図」のお話しをしました。
- その1 定量分析と定性分析
- その2 分析の基本は比較
- その3 古くて新しいQC7つ道具 ※5回に分けてお話し
- その3-1 QC7つ道具の概要
- その3-2 ヒストグラム・管理図・散布図
- その3-3 散布図+α(相関・回帰線)の話題
- その3-4 パレート図・特性要因図
- その3-5 チェックシート・層別 ⇒ 次回
- その4 古くて新しい新QC7つ道具 ※5回に分けてお話し
- その5 要因分析と統計的因果推論 ※3回に分けてお話し
次回は、その3-5の「チェックシート・層別」です。
もっと知りたい方はこちら
14のフレームワークで考える かんき出版 (2014/9/18) |