最近流行りのキーワードです。
- AI(人工知能)
- DL(ディープラーニング)
- DX(デジタルトランスフォーメーション)
- データサイエンス
- IoT(モノのインターネット)
- デジタルマニュファクチュアリング
- xTech
- 自動運転
- AIスピーカー
- チャットボット
- ロボティクス
- データビジネス
- 〇〇プラットファーム
などなど。
最近流行りのキーワードを並べると面白いことが分かります。すべてデータが必要ということです。
今回は、「データ分析・活用でビジネス成果を安定的に確保するための戦略的資産とは」というお話しです。
戦略的資産
戦略的資産とは何でしょうか?
ここでは、戦略的資産を以下のように定義します。
データ分析・活用の基盤を維持するために、
安定的に確保する必要がある資産
「戦略的」というワードからイメージできる通り、「短期的・場当たり的」ではなく「長期的・全体的」といったところです。
では、データ分析・活用の戦略的資産とは何でしょうか?
データ分析・活用の戦略的資産
データ分析・活用の戦略的資産として色々考えられますが、真っ先に挙げらと言われれば、以下の2つでしょう。
- データそのもの
- データから知識獲得する能力
データは、どこからともなくいきなり湧いてきません。知識獲得能力も、天から降ってはきません。
実験計画法
昔、実験計画法というデータ分析・活用には欠かせない、データ収集技術がありました。
「昔」というワードを使いましたが、「今」でも有効ですし使われています。
実験計画法とは、効率的なデータ収集を設計する技術で、分散分析という分析手法の概念と密接に結び付いています。
生産系やマーケティング系では、今でも比較的よく使われています。マーケティング系では、コンジョイント分析という名前で使われていることが多いです。
さらに、ネット系のデータ分析・活用で比較的よく登場する、ABテストや多変量テストも実験計画法の一種です。
ディープラーニング
最近流行りのディープラーニング。
画像認識の世界で成功し、現在色々な分野で適応が試みられています。
ニューラルネットワークの枠組みで語れることが多いですが、今やニューラルネットワークの枠組みで縛られるものではなくなりました。
簡単に言うと、簡単な関数を組み合わせて「深い関数」(表現力の高い関数)を作り、そのパラメータをデータから推定する技術として語られることが多くなりました。つまり、ニューラルネットワークである必要はないわけです。
それはさておき、ニューラルネットワーク系のディープラーニングではある問題があります。
以下の2つの問題は、今現在非常に大きな問題となっていることでしょう。
- どうやってデータを収集するのか?
- どうやってアノテーション(データにラベルなどを与えて正解データを作る)するのか?
学習用のデータは、勝手に生成されません。誰かがデータを集め、学習用データを作る必要があります。
従来型の機械学習は、対象分野(ドメイン)の知識が精度向上に大きく寄与していました。ディープラーニングは、どちらかというとデータと計算量が精度向上に寄与する技術です。
今現在のディープラーニングの世界では、学習で使うデータそのものが大きな資産となっています。
ビッグデータの時代
実験計画法やディープラーニングの世界では、データを集め準備する、というのが大きなポイントです。
実験計画法は、データを集め準備するための技術ですし、ディープラーニングは、データ収集とアノテーション(データにラベルなどを与えて正解データを作る)次第です。
今現在は、ビッグデータの時代とも言われています。
簡単に言うと、量的にはガンガン湧き出てドンドン蓄積されて、質的には玉石混交の時代です。実験計画法やディープラーニングの世界とは、ちょっと異なる世界です。
実験計画法は、少量の良質なデータを取得する技術です。玉石混交のデータをディープラーニングで学習させたら、ヤバイことこの上ないでしょう。使えない何かが生まれます。
ビッグデータ的にデータ分析・活用を考えると、玉石混交のデータでも、無いよりはましです。
十分なデータがなければ、データを分析することも、データを活用することもできません。
玉石混交のデータの場合、クレンジングするという手間暇が発生する可能性が高く、作業コストも莫大になるかもしれません。
しかし、データが無ければ、手間暇すらかけられないのです。それなりのデータを手にする機会や可能性が全く無い、ということです。
そのため、少なくとも、データそのものは戦略的資産です。
データから知識獲得する能力
データそのものを溜めても、ディープラーニングで何かを学習させても、単に溜めたり学習させたりしただけでは、無価値です。
データから知識獲得する能力が必要になります。
知識獲得能力は、個人のスキルかもしれませんし、組織的なものかもしれません。
いきなり、デジタルトランスフォーメーションだ! データビジネスだ! ビッグデータだ! と叫んだところで、データから知識獲得する能力は個人からも組織としても、湧き出てきません。
データから知識獲得する能力は、少なくとも「短期的・場当たり的」には獲得できないと思います。
データから知識獲得する能力のある個人を、外から連れてくるという手もありますが、組織としてデータから知識獲得する能力が無ければ、大組織であればあるほど何も起こらないことでしょう。
相対的に、個人の影響が小さいからです。影響力のある個人(例えば、CEOレベルの人など)を連れてくれば別でしょうが……
要するに、「データから知識獲得する能力」は、戦略的資産ということです。
そのためには、データ分析・活用を成果の多寡や規模に関係なく、組織的なチャレンジをし続ける必要があります。
今回のまとめ
今回は、「データ分析・活用でビジネス成果を安定的に確保するための戦略的資産とは」というお話しをしました。
データ分析・活用の戦略的資産として以下の2つが挙げられます。
- データそのもの
- データから知識獲得する能力
データは、どこからともなくいきなり湧いてきません。知識獲得能力も、天から降ってはきません。
「短期的・場当たり的」ではなく「長期的・全体的」に、この2つの資産を形成していく必要があります。
要するに、とりあえずデータは収集し蓄積したほうがいいし、成果が今一つでもデータ分析・活用は小さくてもいいので、組織的にチャレンジし続けたほうが良いと思います。