データサイエンス実践(データ分析・活用)の成否を左右するのは、テーマ選定にあります。
理由は単純です。
上手くいきそうもないことをいくら頑張っても、上手くいかないからです。
例えば、あなたが陸上選手だとします。
「3ヶ月間のトレーニング期間で100m走を5秒で突破する」というテーマを掲げても、恐らく上手くいかないことでしょう。
例えば、あなたが受験生だとします。
模試の結果から「よく間違っている、かつ、点数の伸びしろが大きい設問」を把握したら、その設問を「3ヶ月間の学習期間で得点源にする」というテーマであれば、恐らく上手くいくことでしょう。
両者の違いは「容易性」(何となくできそう)にあります。
今回は、「データサイエンス実践(データ分析・活用)の容易性を評価する3つの視点」というお話しをします。
テーマ選定の2つの評価軸
色々なテーマ選定軸が考えられますが、よく使うのが次の2つの軸です。
- インパクトの大きさ
- 容易性の程度
「インパクトの大きさ」とは、データ分析・活用することによる、インパクトの大きさです。
ビジネスであれば、売上額やコストダウン額、利益額など金額換算で評価されます。
こちらは、多くの場合定量的な評価になります。
「容易性の程度」とは、データ分析・活用を実現するのに、どの程度容易か(逆に難しののか)を評価したものです。
こちらは、定性的な評価になります。
定性的な評価を一対比較評価などを活用することで、定量化することができます。AHP(Analytic Hierarchy Process、階層分析法)と呼ばれる手法です。AHPについては、別の機会にご説明いたします。
上手くいきやすいテーマとは、「インパクトが大きく、かつ、容易なテーマ」です。
教育目的でインパクトの大きさを考えないのであれば、「容易なテーマ」になります。
容易性を評価する3つの視点
先ほど説明したとおり、「容易性の程度」とは、データ分析・活用を実現するのに、どの程度容易か(逆に難しののか)を評価したものです。
具体的に、何の容易性でしょうか?
色々な容易性が考えられますが、よく使うのが次の3つの容易性です。
- 「取得」に関する容易性
- 「分析」に関する容易性
- 「活用」に関する容易性
どれか1つでも欠けると、実は容易ではなくなります。
それぞれの容易性について、説明します。
「取得」に関する容易性
「『取得』に関する容易性」とは、「データ取得がどれだけ容易か?」を評価したものです。
データの所在を確認したら、データそのものが存在しないのであれば、あまり容易でありません。
データがなくても、取得が比較的簡単であれば、容易になります。
データがあっても、データの状態が非常に汚かったり、データ分析用のデータセットを作るのが大変そうであれば、それは容易とは言えません。
「取得」に関する容易性は、データ分析をする人であれば、必ず評価する視点かと思います。
「分析」に関する容易性
「『分析』に関する容易性」とは、「データの整備や加工、分析、モデル構築などが、どれだけ容易か?」を評価したものです。
「分析」に関する容易性は、若干経験値が必要になります。
データ分析のテーマに取り組むのに……
- どのような集計が必要か
- どのような分析が必要か
- どのようなモデル構築が必要か
……を、データ分析に取り組む前のテーマ設定の段階で、ある程度見えていないといけないからです。
データ分析の経験値が不足している人は、テーマ選定の段階ではなく、データ分析をしながら評価することになるかもしれません。
とは言え、「分析」に関する容易性は、どこかのタイミングで必ず評価する視点かと思います。
「活用」に関する容易性
「『活用』に関する容易性」とは、「現場で、実際に活用し成果を得るのが、どれだけ容易か?」を評価したものです。
この「現場」とは、データ分析を活用する現場です。
経営の現場の場合もあれば、生産の現場の場合もあります。営業の現場のこともあれば、経理の現場の場合もあります。
残念ながら、「活用」に関する容易性の評価は、サボられがちです。
3つの容易性の評価の中で一番重要です。
なぜならば、活用されなければ、そのデータ分析・活用の取り組みは、当然上手くいきません。
活用されないのですから、当然と言えば当然ですが、現場で活用しやすいかどうかの視点が、テーマ設定時で抜けているケースが結構あります。
この「『活用』に関する容易性の評価」は、活用する現場の意見が無いことには評価不可能です。
現場の「やりたい」「やれそう」「イメージが付く」「こうしてもらえればできる」などが、この「『活用』に関する容易性の評価」では必要になります。
現場から「やりたくない」「できなさそう」「イメージが付かない」などの意見が出たら、まずデータ分析・活用は実現されません。
テーマ選定の段階で……
- このような現場の意見を取り入れていない、
- 聞きに行っていない、
- そもそも接触していない、
……といった状況の場合、データ分析・活用がギャンブルになってしまいます。
やるかやらないかは「現場まかせ」となるからです。
今回のまとめ
今回は、「データサイエンス実践(データ分析・活用)の容易性を評価する3つの視点」というお話しをしました。
データサイエンス実践(データ分析・活用)の成否を左右するのは、テーマ選定にあります。
色々なテーマ選定軸が考えられますが、よく使うのが次の2つの軸です。
- インパクトの大きさ
- 容易性の程度
「インパクトの大きさ」とは、データ分析・活用することによる、インパクトの大きさです。
ビジネスであれば、売上額やコストダウン額、利益額など金額換算で評価されます。
「容易性の程度」とは、データ分析・活用を実現するのに、どの程度容易か(逆に難しののか)を評価したものです。
色々な容易性が考えられますが、よく使うのが次の3つの容易性です。
- 「取得」に関する容易性:データ取得がどれだけ容易か?
- 「分析」に関する容易性:データの整備や加工、分析、モデル構築などが、どれだけ容易か?
- 「活用」に関する容易性:現場で、実際に活用し成果を得るのが、どれだけ容易か?
どれか1つでも欠けると、実は容易ではなくなります。
3つの容易性の評価の中で一番重要なのが、「『活用』に関する容易性」です。
なぜならば、活用されなければ、そのデータ分析・活用の取り組みは、当然上手くいきません。
現場で活用しやすいかどうかの視点が、テーマ設定時で抜けているケースが結構あります。
そのためには、現場に行って議論をしたり、インタビューをしたりと、何かしらのコミュニケーションが必要になります。
ちなみに、現場から「やりたい」「やれそう」「イメージが付く」「こうしてもらえればできる」などの意見の声が多ければ容易性の評価は高くなります。
一方、現場から「やりたくない」「できなさそう」「イメージが付かない」などの意見の声が多ければ容易性の評価は低くなります。
なんとなく、データ分析・活用が上手くいかないと感じましたら、3つの容易性の視点でテーマそのものを考え直してみては、いかがでしょうか。