ある業界のリーディングカンパニーの、データ分析組織の責任者が、ある問題に頭を悩ましていました。
「データ活用が上手くいったけど、大きな壁が……」
贅沢な悩みかもしれませんが、悩みを先取りしているとも言えます。
データ分析・活用にチャレンジし右往左往している企業を傍目に、データ分析・活用も上手くいくようになった企業です。
その企業は、ある特定の領域に限っただけでも、データ分析人財が300人を超えていました。外から見ると、順風満帆で何も問題のないようにさえ思えました。
しかし、データ分析・活用が属人化してしまい、そのことを危惧していたのです。
今回は、「データ活用が上手くいったけど、次に大きな壁があった! データ分析・活用ナレッジの蓄積・共有・継承」というお話しをします。
属人化しやすいデータ分析
ナレッジマネジメントという言葉があるとおり、ビジネス上の業務のナレッジを蓄積し共有し活用すること自体、大きな課題なのかもしれません。
データ分析も他の業務と同じで、ナレッジを蓄積し共有し活用すること自体、大きな課題になります。
私は約20年間、データ分析に関わってきましたが、データ分析そのものは属人化しやすい傾向になると思います。
データ分析者は、どちらかというと職人的な感じの要素を持ち合わせているように、私には見えます。
口頭で伝えるのが難しい、ちょっとした何かがあるのです。
私の経験ですが、非常に非論理的で、非常に感覚的な何かが、データ分析そのものの出来を決めることが、少なくありません。
調べてみれば、使っているツールからしてばらばら
データ分析者の多くは、自分の好みのデータ分析ツールで、データ分析をしているようです。
フリーツールであれば、RとPythonが現在有名ですが、どちらを使うかは、完全に好みの違いです。有料のツールであれば、SPSSやSAS、MATLABなどが有名ですが、どれを使うのかも、完全に好みの違いです。
有料ツールの場合、組織として一括して購入することが多いので、その組織長か影響力の強い人の好みでツールが決定されているように思えます。
実際、データ分析や実施している人や組織を調べれば、バラバラであることが分かります。
私のいたある組織では実際に、ある開発の部署ではSASを購入し、ある事業部ではSPSSを購入し、中央研究所ではMATLABを購入していました。
個人単位で話しを聞いてみると、エンジニア系の人はPythonを使い、統計解析系の人はRを使っていました。
有料ツールが本当に必要なのかと思いましたが、それはそれとして、少なくとも人や組織が異なれば、ツールからしてばらばらでした。
ツールを揃えようとしたら、大反発!!!
分析ツールぐらい揃えようという話しになり、揃えるためのプロジェクトが発足したのですが、上手くいきませんでした。
予想以上に、今まで使っていたツールへの愛着というかこだわりが強かったのです。
プロジェクトの開始とともに大反発が起こり、そのうちプロジェクトの存在が無視されるようになり、統一してた有料の分析ツールが決定したにも関わらず、まったく広まりませんでした。
過去の継続性という観点から、今まで使っていた有料ツールもある程度の期間継続契約することなったことも、大きな問題の要因でした。
共有化すべきは、ツールではなく、ナレッジだ
よくよく考えてみれば、ツールを統一したからと言って、データ分析・活用ナレッジの蓄積・共有・継承が上手くいくとは限りません。
でも、ツールを統一したほうが、データ分析・活用ナレッジの蓄積・共有・継承が進みやすいとは思いますが……
ということで、本来のデータ分析・活用ナレッジに焦点を当てるようにしました。
データ分析・活用ナレッジは、ある種のメタデータです。メタデータと言えどもデータです。他のデータ同様に、データを蓄積すればいいのです。
しかし、多くの場合、定量的なデータだけで完結することなく、定性的なデータをいかに蓄積するのかが重要になってきました。
2つのメタデータ
すぐできるものとして、次の2つの取り組みをしました。
- ①データ分析プロジェクトの軌跡の見える化
- ②失敗事例の蓄積と共有
詳細は次回以降の同コラムでお話ししますが、どちらもすぐにできることです。
①の「データ分析プロジェクトの軌跡の見える化」は、私が20代のころに1人で実施していたことを、元にしています。
私は新卒時、データ分析を専門にする組織に配属されました。歴史と伝統のある組織であったため、たくさんのデータ分析プロジェクトの足跡が残っていたのです。
組織の中で最も経験もスキルもない私がやったのが、過去のデータ分析プロジェクトを再現するということです。その副産物として、データ分析プロジェクトの軌跡が見える化されました。
このことは、ナレッジの共有・継承(教育)と蓄積に大いに役立ちます。
②の「失敗事例の蓄積と共有」は、文字通り、データ分析プロジェクト中に発生したちょっとした失敗談を溜めていくということです。
②のほうが①に比べ簡単にできますが、組織によっては全く進みません。失敗を許容できる風土でないと、やや困難が伴いますが、上手くいくと非常にいい試みです。
今回のまとめ
今回は、「データ活用が上手くいったけど、次に大きな壁があった! データ分析・活用ナレッジの蓄積・共有・継承」というお話しをしました。
多くの業務と同じように、データ分析という業務も属人化しやすい印象があります。
そういう意味で、何かしらナレッジマネジメントをしないと、データ分析・活用がどんない上手くいったとしても、一抹の不安が残ります。
そのデータ分析者がいなくなったら、どうなっちゃうの…… と
職人や芸術家が自分好みの道具で仕事をするように、データ分析者も自分好みの分析ツールで分析し、組織としてなかなか統一が難しいような印象があります。
実際、データ分析や実施している人や組織を調べれば、バラバラであることが分かります。私のいたある組織では実際そうでした。
そもそも論で考えれば、「共有化すべきは、ツールではなくナレッジ」です。正直、ツールを統一したほうが、データ分析・活用ナレッジの蓄積・共有・継承が進みやすいとは思いますが、難しいので、私はやりやすいところから実施しました。
当時実施したものは、次の2つの取り組みです。すぐできるものです。
- ①データ分析プロジェクトの軌跡の見える化
- ②失敗事例の蓄積と共有
詳細は次回以降の同コラムでお話しします。
ちなみに、②の「失敗事例の蓄積と共有」に関しては、ある企業内の取り組みを書籍(データサイエンティストの秘密ノート 35の失敗事例と克服法)として出版していますので、興味のある方はご覧頂ければと思います。