たまに、「折角だからこのデータを使って!」的なことがあります。
そのデータを溜めるまでに多大なる労力を要したのか、データ整備に多大なる時間を要したのか、ITシステム周りでコストが掛かったのか、何かは知りませんが、特定のデータに執着される方も、少なくありません。もちろん、そうでない人のほうが多いかもしれませんが……
そのデータを使うかどうかは、解決すべき課題次第です。
解決すべき課題にとって必要であれば、そのデータは必要ですし、不必要であれば不必要です。
今回は、「折角だからこのデータを使って! と言われ無理に使うと面倒なことになる」というお話しをします。
データ起点で考える不幸
データに執着するときに、もっとも多いパターンが、データ起点でデータ活用を考えるという不幸です。
不幸とは、ビジネスの現場で何ら成果を生み出せず、労力が無駄になることを言っています。
データ起点で考えるときに出てくる、典型的な口癖です。
- 「このデータで何ができるのか?」
具体的なデータ名で言い換えます。
- 「営業の受発注データあるけど、このデータで何ができる?」
- 「コールセンターのデータあるけど、このデータで何ができる?」
- 「工場のセンサーデータあるけど、このデータで何ができる?」
今、ある赤ちゃんが目の前にいます。
- 「この赤ちゃん、将来どうなりますか?」
難問です。赤ちゃんには無限の可能性があるからです。
実は、データにも無限の可能性があります。
何ができるのかが知りたいのなら、何をしたほうがいいのかという探索的なデータ分析から始めたほうがいいでしょう。
先程の赤ちゃんの例で考えると、その赤ちゃんを見ながら、将来こんな子になるかも、あんな子かもしれない、と考えるということです。そこには、考える人の願望が入ります。データ活用も同様です。
何をしたいのかという願望がないことには、なかなか難しいことです。
無理くり登場させロジック崩壊の危機
エライ人からの肝いりのデータは、データ分析をするときや数理モデル構築するときなどに、強引にでも登場させなければならないことがあります。
「あのデータどうだった?」みたいに聞かれるからです。
そのデータをどこかに登場させるロジックを組まなければなりません。恐ろしく頭を酷使する必要があります。
ストーリーをうまく考えないと、無理くり感がにじみ出てきます。困ったものです。
使ったふりをする無駄作業
ある大企業で、色々なDBや部署などに点在しているデータを集約するためのデータレイクをクラウド上に、数年かけて構築しました。
そのデータレイク上のデータをメインで使えというデータ縛りに、その企業のデータサイエンティストたちは非常に困っていました。結局、そのデータレイク構築を主導した役員の退任とともに、そのデータレイクは見向きもされなくなりましたが、今でも稼働し毎月膨大なコストが発生しています。
その企業のデータサイエンティストたちがなぜ困っていたかというと、データレイクには上げやすいデータ(ある程度きれいなデータなど)しか上がっておらず、現場課題を解決するような泥臭いデータはデータレイクには存在せず、各現場のDBなどに留まった状態だったからです。
そのような状況の中、データレイクにあるデータを、データ分析や数理モデル構築などをするときに、無理くり登場させるために、それなりの時間を必要としていたからです。
そこまで酷くないまでも、「折角だからこのデータも考慮してみて」みたいな権威のある人の軽い一言が、データ分析者やデータサイエンティスト、機械学習エンジニアなどを苦しめることがあります。
そのようなデータを使わないときは、使わない利用を説明する手間が発生するからです。思考と時間の無駄です。
使ったふりと知らずにシステム維持されコスト垂れ流し
その企業のデータサイエンティストたちのデータ分析結果などのパワーポイントのレポートに、「〇✕△分析結果 with 〇〇〇」という感じで、常に〇〇〇(データレイクの名称)が記載されていました。
データレイクのデータを使ったどうかに関係なくです。今流行りの単語で言えば「忖度」(そんたく)です。
〇〇〇(データレイクの名称)は今や、その企業独自のAIプラットフォームと勘違いするぐらいのパワーを持ち始めています。
要は、使ったふりをする無駄作業が発生し、使ったふりと知らずにそのデータレイクは維持され、お金だけ垂れ流し状態です。
あんたの会社でも、このように、上手くいっていることになっているDX投資やIT投資が、誰も指摘せず、無駄に維持されコスト垂れ流し状態になっているかもしれません。
今回のまとめ
今回は、「折角だからこのデータを使って! と言われ無理に使うと面倒なことになる」というお話しをしました。
たまに、「折角だからこのデータを使って!」的なことがあります。
そのデータを溜めるまでに多大なる労力を要したのか、データ整備に多大なる時間を要したのか、ITシステム周りでコストが掛かったのか、何かは知りませんが、特定のデータに執着される方も、少なくありません。もちろん、そうでない人のほうが多いかもしれませんが……
そのデータを使うかどうかは、解決すべき課題次第です。解決すべき課題にとって必要であれば、そのデータは必要ですし、不必要であれば不必要です。
データに執着するときに、もっとも多いパターンが、データ起点でデータ活用を考えるという不幸です。
データ起点で考えるときに出てくる、典型的な口癖です。
- 「このデータで何ができるのか?」
具体的なデータ名で言い換えます。
- 「営業の受発注データあるけど、このデータで何ができる?」
- 「コールセンターのデータあるけど、このデータで何ができる?」
- 「工場のセンサーデータあるけど、このデータで何ができる?」
このような声が聞こえてきたら要注意です。
何ができるのかが知りたいのなら、何をしたほうがいいのかという探索的なデータ分析から始めたほうがいいでしょう。