集めるデータのイメージが付いたら、次にデータを集めなければなりません。
データ集める際にデータ品質が高いのが理想です。データ品質が低いと、後々のデータ分析やアクションなどに悪い影響を及ぼします。
データ品質を決めるのは、データの前提をきちんと認識しておくことです。
データの「収集」について全5回にわたってお話しいたします。
- その1 データソースの種類
- その2 まずはセカンダリーデータ
- その3 より正確にはプライマリーデータ
- その4 最重要なのはデータの前提 ⇒ 今回
- その5 データは対で集める
前回は、その3の「より正確にはプライマリーデータ」についてお話ししました。
今回は、その4の「最重要なのはデータの前提」というお話しをします。
Contents
外してはいけないポイント
データがプライマリーデータであろうがセカンダリーデータであろうが外してはいけないポイントがあります。
それは、「データの前提」です。
データの前提とは、データの履歴書です。7何(6W1H)で表現されます。
- 誰が?:データを企画し集めた人・組織
- 誰に対し:データ収集対象者
- なぜ?:集めた目的
- いつ?:集めた時期
- どこで?:集めた場所(対象者のエリアなど)
- 何を?:集めたデータの内容
- どのように?:データの集め方
データの前提はデータ分析に多大なる影響がある
データ分析は、データの前提から大きな影響を受けます。
データの前提を把握していないデータ分析はありえません。
例えば……
- 米国の売上データを分析しても日本の売上データを分析したことにはなりません。集めた場所が異なりまる。
- 10年前のデータを分析して今を語ることはできません。集めた時期が異なります。
一番気を付けたほうが良いこと
一番気を付けたほうが良いのが「誰が企画し集めたか?」ということです。
不思議なことに、誰が企画し集めたかでデータが微妙に異なることがあります。
例えば、プライマリーデータはセカンダリデータに比べ、時間とお金をより多くかけてデータを集めるます。
自分たちが欲しいデータを得たいがためです。その気持ちがデータ企画や収集に微妙に影響します。
最初にすべきこと
最初にすべきことは、本当に集めたいデータの前提を明らかにすることです。
本当に集めたいデータの前提が明らかになれば、どのようなデータを集めるべきか分かります。
プライマリーデータであっても、多くの場合、どんなに気を付けて集めたとしても、集めたいデータの前提と集めたデータの前提はずれます。
セカンダリ―データの場合には、当然のごとく、集めたいデータの前提と集めたデータの前提はずれます。
したがって、どんなに都合の良いセカンダリ―データでも、時間とお金をかけて集めたプライマリーデータであっても、データの前提がはっきりしないデータは避けましょう。
前提なくしてデータを企画し集めることはできません
データの前提をしっかり把握しよう! となるとセカンダリ―データだけだろ…… と思われる方もいますが、プライマリーデータもデータの前提は非常に重要です。
なぜならば、データの前提なくしてデータを企画し集めることはできないからです。
例えば、次のような流れになることでしょう。
- 本当に集めたいデータの前提を明らかにする
- そして、実際に自ら企画する
- 実際にデータを収集する
データの前提のずれはデータを集めた時にきちんと記録する
先ほどもお話ししましたが、多くの場合、どんなに気を付けて集めたとしても、集めたいデータの前提と集めたデータの前提はずれます。
どの前提がどれほどずれたのか、そのずれをきちんと認識しておきましょう。
そのためにも、データの前提のずれはデータを集めた時にきちんと記録しておきましょう。
意外と、そこが抜け落ちているケースが多々あり、企画段階の前提と実際の得られたデータのずれを分析するところから始まるケースも少なくないです。
前提のずれを認識して解釈する
先ほども言いましたが、集めたいデータの前提と集めたデータの前提はずれます。
実際にデータ分析をするときは、そのずれを認識しデータを分析すべきです。
特に、データ分析の結果を解釈するとき、その前提のずれを認識し解釈すべきです。
このことを怠ると、間違った解釈をする危険性があります。
間違った解釈からは間違ったアクションが導かれます。間違ったアクションで目的を達成することは困難になります。
つまり、データ品質で最重要なのは「データの前提」を明確にしておくということです。
次回
今回は、その3の「より正確にはプライマリーデータ」というお話しをしました。
- その1 データソースの種類
- その2 まずはセカンダリーデータ
- その3 より正確にはプライマリーデータ
- その4 最重要なのはデータの前提
- その5 データは対で集める ⇒ 次回
次回は、その5の「データは対で集める」というお話しをします。
もっと知りたい方はこちら
14のフレームワークで考える かんき出版 (2014/9/18) |