データ活用をするとき、「見える化」というキーワードが多々出てきます。
- 取り急ぎ「見える化」するためにデータを集めよう
- DX(デジタルトランスフォーメーション)の初手として「見える化」から始めましょう
- データ環境を整備し「見える化」に成功。我が社もDXしてるぞ!
- 「見える化」なんてダサすぎる。もっとディープなラーニングがいい……
- 「見える化」は単なる集計。データ分析とは言えないしデータサイエンスではない
「見える化」は、憧れの目標にされたり、ディスられたり、大変です。
今回は、「見える化の魔力」という話しをします。
Contents
データ活用の約半分は、見える化だけで解決する
データ分析やデータサイエンスなどをキーワードで、ビジネス活用をそれなりに経験している人の多くは、次のように感じているのではないでしょうか?
「見える化だけで十分じゃん……」
データ分析だのデータサイエンスだのビッグデータだの機械学習だの偉そうに不思議ワードを連発しても、結局のところ、集計レベルのデータ活用で解決することも少なくありません。
データサイエンティストになりたい! と意気込みこの業界に入ってきた人の中には、集系レベルの簡易なデータ分析業務にガッカリする人もいることでしょう。
そんなもんです。
多くの場合、単なる集計
「見える化」しました…… と言うとき、そのアウトプットの多くは、単なる集計結果です。
単純集計・クロス集計などです。それをグラフ化し見やすくします。
単なる集計も、データサイエンス風に、対数線形モデルだのポアソン回帰モデルだの多項分布ロジスティック回帰モデルだのと命名すれば、少しはかっこよくなるかもしれません。
実は、ディスられるほど、平易なものではありません。
この手のモデルを使えば、重要そうなクロス集計を探し出したり(意味のある集計軸の探索)などを実施できますし、モニタリングしている集計値(指標)の異常検知などを実施することもできます。
でも、ぱっと見は、単なる集計とグラフです。
活用現場を混乱させそっぽを向かれたら本末転倒
データ活用する現場の人の多くは、データ分析者やデータサイエンティスト、機械学習エンジニアではありません。普通のビジネスパーソンです。
普通のビジネスパーソンにとっては、分けのわからないアウトプットを提供されるより、ぱっと見が集計とグラフの方が分かりやすく感じてもらえるでしょう。
ある日、LightGBMという数理モデルを使って分析していたデータサイエンティストが、現場の人にSHAP (SHapley Additive exPlanations)の値を一所懸命説明していました。
現場の人にSHAPの数値が○○となっています…… と言っても、恐らく「???」だと思います。
それなら、売上が10%上がった下がったの方が分かりやすいです。
現場の人にSHAPの数値と、現場で起こっていることが頭の中でリンクしないと、当然ですが「???」となると思います。
本人に……
「なぜ、LightGBMを使ったの? なぜ、SHAPで語ろうとしたの?」
と聞いたら……
「実務で使ってみたかった」
目も当てられない回答が返ってきました。
活用現場を混乱させそっぽを向かれたら本末転倒です。
そっぽを向かれたら、そのデータ分析の結果は、現場で活用されません。そこにかけた工数も、その報告を聞いた現場の人の時間も、全くの無駄になったということです。
この場合、SHAP (SHapley Additive exPlanations)が悪いと言うわけではありません。
問題は、何を集計し見える化しているのか、ということ
「見える化」さえすれば、物事は良い方向に向かうのか、というとそうでもありません。
だからと言って、高度なデータサイエンスや機械学習の技術が必要だ! という単純な話しでもありません。
もちろん、高度なデータサイエンスや機械学習の技術でどうにかなることもあります。
データを蓄積し「見える化」しているの上手くいかないケースの中には、「見える化」しているものが可笑しいケースも少なくありません。
現場に活用し難い集計結果を提供しているケースです。
現場で活用される集計結果やグラフは、どのようなものなのかを、しっかり考える必要があります。
そのためには、当然ながら現場の人を交えて議論する必要があります。
個人的には、現場の人が一切介在しないデータ分析やデータサイエンスは、ありえないと思っています。
データ分析者やデータサイエンティスト、機械学習エンジニアなどと呼ばれる人は、それを活用する現場の人(エンドクライアント)と一度も接したことがないという状況に陥らないようにしましょう。
打ち手(アクション)が見えれば嬉しいね
データ分析の結果などを活用する現場の人(エンドクライアント)が見たいのは、打ち手(アクション)です。
別に、集計結果やグラフ、SHAPなどを見たいわけではありません。
次に何をすればいいのかを知りたいのです。
そのデータ分析の結果などを見て、それを活用する現場の人(エンドクライアント)が次に何をすべきか分かるのであれば、そのアウトプットは正解でしょう。
その正解、不正解を簡単に確かめることができます。
それは、データ分析の結果などを、それを活用する現場の人(エンドクライアント)の人に見せたとき……
「で?」
……という反応が返ってきたら、そのアウトプットは不正解です。
何かが間違っています。
今回のまとめ
今回は、「見える化の魔力」という話しをしました。
データ活用をするとき、「見える化」というキーワードが多々出てきます。
- 取り急ぎ「見える化」するためにデータを集めよう
- DX(デジタルトランスフォーメーション)の初手として「見える化」から始めましょう
- データ環境を整備し「見える化」に成功。我が社もDXしてるぞ!
- 「見える化」なんてダサすぎる。もっとディープなラーニングがいい……
- 「見える化」は単なる集計。データ分析とは言えないしデータサイエンスではない
「見える化」は、憧れの目標にされたり、ディスられたり、大変です。
データ分析・活用(データサイエンス実践)という観点から考えると、約半分は見える化だけで解決します。
しかし、データ分析者やデータサイエンティスト、機械学習エンジニアなどと呼ばれる人の興味関心という名のエゴで、小難しい分析技術を使い、分けのわからないアウトプットを提供し現場を混乱させさっぽを向かれ、結果的に現場で活用されず失敗に終わることも多々あります。
また、「見える化」の名の御旗のもとで集計している何かが、現場で活用し難いものになっているケースで失敗することも多々あります。
データ分析の結果などを、それを活用する現場の人(エンドクライアント)の人に見せたとき……
「で?」
……という反応が返ってきたら、何かが間違っています。
データ分析の結果などを活用する現場の人(エンドクライアント)が見たいのは、打ち手(アクション)です。データでも、その集計結果でも、美しいグラフでも、小難しい技術でもありません。
本当に、データを活用し成果を上げたいなら、当然ながら現場の人を交えて、形式的な議論(ステコミや定例会など)だけではなく、現場の業務に深く入り込んだ議論をする必要があります(たぶん)。