第134話|やってみなはれの精神でデータで石橋を叩きながら渡る

第134話|やってみなはれの精神でデータで石橋を叩きながら渡る

ビジネスにおけるデータサイエンスに対し、どのような印象があるでしょうか。

人によっては、魔法のような不思議さを感じる方もいれば、最新のテクノロジーを使った派手なイメージをするかたもいます。

サイエンスという響きが、通常のテクノロジーを凌駕した不思議さを醸し出し、最近のAIブームが、魔法っぽさを醸し出しているようです。

実状は異なります。

今回は、「やってみなはれの精神でデータで石橋を叩きながら渡る」というお話しをします。

石橋を叩いて渡る

石橋を叩いて渡る」ということわざがあります。ご存知の方も多いことでしょう。

意味は、用心に用心を重ねて物事を行うことで、用心深さに対する皮肉を込めて使われることが多いです。

確かに、壊れる可能性が低い頑丈な石の橋を叩き、強度を確かめながら渡るのですから、相当用心深いことが伺えます。

笑い事ではありません。実は、データ活用をするということは、「石橋を叩いて渡る」ようなものだからです。

データでリスクを減らす

なぜ、データ活用をするということが、石橋を叩いて渡るようなものなのでしょうか。

例えば、データが全くない状態で、明日の来月の売上を予測することは至難の業です。

データがあることで、来月の売上に対し、何らかのあたりを付けることができます。

例えば、昨年の同じ月の売上が50億円だったから、来月の売上は50億円ぐらいだろう、とか。

例えば、今月の売上は昨年に比べ10%高いから、来月の売上も昨年に比べ10%高いだろうから、55億円ぐらいかな、とか。

そういった感じです。

〇〇をしたら□□になる

ここで、「法人営業の訪問回数を昨年に比べ1.2倍に増やしたので売上が10%高くなった」という関係性が分かるとどうでしょうか。

多くの場合、さらに嬉しいでしょう。なぜならば、アクションと売上が紐づいているからです。

このような関係は、データさえあれば見つけ出すことができます。

ちなみに、説明変数と目的変数というワードでよく説明されます。

  • 説明変数 X:訪問回数
  • 目的変数 Y:売上

つまり、XとYの関係性をデータから見出すということです。

この「XとYの関係性をデータから見出す」ことができると、リスクを減らすことができるのです。

統計モデルなどを思い浮かべると分かりやい

統計モデルなどを思い浮かべると分かりやいです。

リスクとは分散(もしくは標準偏差)の大きさを意味するからです。

統計モデルを上手く構築することで、目的変数 Yの分散を小さくすることができるのです。もちろん、モデル上のお話しです。

統計学に馴染みがない方にとって、統計モデルや分散という言葉を使うと、より分かりにくくなるとかと思います。

そこで、簡単に説明します。

簡単に説明します

分散とは、目的変数 Y(例では売上)のバラつきの大きさのことです。

実際に、データの値が大きくばらついている場合、分散が大きくなります。データがある値の近くに集中している場合、分散は小さくなります。

予測する上で、このバラつき(分散)は小さいとほうが嬉しいでしょう。

なぜでしょうか。

来月の売上Yの分散が大きいとは、来月の売上Yの値がどうなるかわからない(振れ幅が大きいい)、ということです。

例えば、「来月の売上は10億円から90億円の間である」、といった感じです。

そこで、過去の売上データや、説明変数となるデータ(例では営業訪問回数)などがあると、この売上Yの分散を小さくすることができます。

例えば、「来月の売上は49億円から51億円の間である」、といった感じです。

このように、データがあればあるほど、どうなるか分からないといった蓋然性が減ることで、リスクが減っていきます

やってみなければ、データは溜まらない

データさえあれば、実施する前にどうなるかの目途が立ち、リスク少なく物事が上手く運べる、といった感じでしょう。

しかし、落とし穴があります。「データさえあれば」というところにです。

データさえあれば実施する前に目途が立ちますが、データは実施しなければ溜まりません。

やってみなければデータは溜まらないということです。

データサイエンスやデータ分析活用は、データがなければ無力です。

要するに、先ずは「やってみなはれの精神で、やってみる」、そして「溜まったデータで石橋を叩きながら渡る」といった感じです。

このサイクルが上手く回りだすと、どんどんいい方向にいくことでしょう。

今回のまとめ

今回は、「やってみなはれの精神でデータで石橋を叩きながら渡る」というお話しをしました。

実は、データ活用をするということは、「石橋を叩いて渡る」ようなものだからです。

なぜでしょうか。

データを上手く活用することで、リスクを減らすことができるからです。

一体どのように? と感じる方もいることでしょう。

例えば、統計モデルを上手く構築することで、リスクを減らすことができます。来月の売上の予測値の確度を上げることができる、ということです。

このとき、営業訪問などのアクションとの紐づけができると嬉しいことでしょう。

例えば、法人営業の訪問回数を昨年に比べ1.2倍に増やすと売上が10%高くなる、といったことです。

もちろん、アクションに対する生産性や効率性、コストパフォーマンスなどを考慮する必要はあります。