第166話|データサイエンス実践(データ分析・活用)の容易性を評価する3つの視点

第166話|データサイエンス実践(データ分析・活用)の容易性を評価する3つの視点

データサイエンス実践データ分析・活用)の成否を左右するのは、テーマ選定にあります。

理由は単純です。

上手くいきそうもないことをいくら頑張っても、上手くいかないからです。

例えば、あなたが陸上選手だとします。

3ヶ月間のトレーニング期間で100m走を5秒で突破する」というテーマを掲げても、恐らく上手くいかないことでしょう。

例えば、あなたが受験生だとします。

模試の結果から「よく間違っている、かつ、点数の伸びしろが大きい設問」を把握したら、その設問を「3ヶ月間の学習期間で得点源にする」というテーマであれば、恐らく上手くいくことでしょう。

両者の違いは「容易性」(何となくできそう)にあります。

今回は、「データサイエンス実践(データ分析・活用)の容易性を評価する3つの視点」というお話しをします。

テーマ選定の2つの評価軸

色々なテーマ選定軸が考えられますが、よく使うのが次の2つの軸です。

  • インパクトの大きさ
  • 容易性の程度

インパクトの大きさ」とは、データ分析・活用することによる、インパクトの大きさです。

ビジネスであれば、売上額やコストダウン額、利益額など金額換算で評価されます。

こちらは、多くの場合定量的な評価になります。

容易性の程度」とは、データ分析・活用を実現するのに、どの程度容易か(逆に難しののか)を評価したものです。

こちらは、定性的な評価になります。

定性的な評価を一対比較評価などを活用することで、定量化することができます。AHP(Analytic Hierarchy Process、階層分析法)と呼ばれる手法です。AHPについては、別の機会にご説明いたします。

上手くいきやすいテーマとは、「インパクトが大きく、かつ、容易なテーマ」です。

教育目的でインパクトの大きさを考えないのであれば、「容易なテーマ」になります。

容易性を評価する3つの視点

先ほど説明したとおり、「容易性の程度」とは、データ分析・活用を実現するのに、どの程度容易か(逆に難しののか)を評価したものです。

具体的に、何の容易性でしょうか?

色々な容易性が考えられますが、よく使うのが次の3つの容易性です。

  • 取得」に関する容易性
  • 分析」に関する容易性
  • 活用」に関する容易性

どれか1つでも欠けると、実は容易ではなくなります。

それぞれの容易性について、説明します。

「取得」に関する容易性

『取得』に関する容易性」とは、「データ取得がどれだけ容易か?」を評価したものです。

データの所在を確認したら、データそのものが存在しないのであれば、あまり容易でありません。

データがなくても、取得が比較的簡単であれば、容易になります。

データがあっても、データの状態が非常に汚かったり、データ分析用のデータセットを作るのが大変そうであれば、それは容易とは言えません。

「取得」に関する容易性は、データ分析をする人であれば、必ず評価する視点かと思います。

「分析」に関する容易性

『分析』に関する容易性」とは、「データの整備や加工、分析、モデル構築などが、どれだけ容易か?」を評価したものです。

「分析」に関する容易性は、若干経験値が必要になります。

データ分析のテーマに取り組むのに……

  • どのような集計が必要か
  • どのような分析が必要か
  • どのようなモデル構築が必要か

……を、データ分析に取り組む前のテーマ設定の段階で、ある程度見えていないといけないからです。

データ分析の経験値が不足している人は、テーマ選定の段階ではなく、データ分析をしながら評価することになるかもしれません。

とは言え、「分析」に関する容易性は、どこかのタイミングで必ず評価する視点かと思います。

「活用」に関する容易性

『活用』に関する容易性」とは、「現場で、実際に活用し成果を得るのが、どれだけ容易か?」を評価したものです。

この「現場」とは、データ分析を活用する現場です。

経営の現場の場合もあれば、生産の現場の場合もあります。営業の現場のこともあれば、経理の現場の場合もあります。

残念ながら、「活用」に関する容易性の評価は、サボられがちです。

3つの容易性の評価の中で一番重要です。

なぜならば、活用されなければ、そのデータ分析・活用の取り組みは、当然上手くいきません

活用されないのですから、当然と言えば当然ですが、現場で活用しやすいかどうかの視点が、テーマ設定時で抜けているケースが結構あります。

この「『活用』に関する容易性の評価」は、活用する現場の意見が無いことには評価不可能です。

現場の「やりたい」「やれそう」「イメージが付く」「こうしてもらえればできる」などが、この「『活用』に関する容易性の評価」では必要になります。

現場から「やりたくない」「できなさそう」「イメージが付かない」などの意見が出たら、まずデータ分析・活用は実現されません。

テーマ選定の段階で……

  • このような現場の意見を取り入れていない、
  • 聞きに行っていない、
  • そもそも接触していない、

……といった状況の場合、データ分析・活用がギャンブルになってしまいます。

やるかやらないかは「現場まかせ」となるからです。

今回のまとめ

今回は、「データサイエンス実践(データ分析・活用)の容易性を評価する3つの視点」というお話しをしました。

データサイエンス実践(データ分析・活用)の成否を左右するのは、テーマ選定にあります。

色々なテーマ選定軸が考えられますが、よく使うのが次の2つの軸です。

  • インパクトの大きさ
  • 容易性の程度

インパクトの大きさ」とは、データ分析・活用することによる、インパクトの大きさです。

ビジネスであれば、売上額やコストダウン額、利益額など金額換算で評価されます。

容易性の程度」とは、データ分析・活用を実現するのに、どの程度容易か(逆に難しののか)を評価したものです。

色々な容易性が考えられますが、よく使うのが次の3つの容易性です。

  • 取得」に関する容易性:データ取得がどれだけ容易か?
  • 分析」に関する容易性:データの整備や加工、分析、モデル構築などが、どれだけ容易か?
  • 活用」に関する容易性:現場で、実際に活用し成果を得るのが、どれだけ容易か?

どれか1つでも欠けると、実は容易ではなくなります。

3つの容易性の評価の中で一番重要なのが、「『活用』に関する容易性」です。

なぜならば、活用されなければ、そのデータ分析・活用の取り組みは、当然上手くいきません

現場で活用しやすいかどうかの視点が、テーマ設定時で抜けているケースが結構あります。

そのためには、現場に行って議論をしたり、インタビューをしたりと、何かしらのコミュニケーションが必要になります。

ちなみに、現場から「やりたい」「やれそう」「イメージが付く」「こうしてもらえればできる」などの意見の声が多ければ容易性の評価は高くなります。

一方、現場から「やりたくない」「できなさそう」「イメージが付かない」などの意見の声が多ければ容易性の評価は低くなります。

なんとなく、データ分析・活用が上手くいかないと感じましたら、3つの容易性の視点でテーマそのものを考え直してみては、いかがでしょうか