ビジネスの現場で売上などの数値を予測することは多いでしょう。
例えば、予測モデルを構築し予測したり、例年踏襲型で数値を予測したりします。
例年踏襲型とは、昨年と同額もしくは昨対比10%UPみたいな感じの予測というものです。
予測対象域は未来のため、何かしら想定と言うかシナリオを考える必要もでてきます。
今回は、「売上などの数値予測は少なくとも9つのシナリオで実施する」というお話しです。
点予測は100発0中が当たり前
数理モデルなどを活用し、来年度の売上予測は「152億3,2987万1,827円」などと言う感じの、点予測の値を出すことは可能です。
恐らく、その年の売上が「152億3,2987万1,827円」になることは、ほとんどありません。
1つの値だけを予測する点予測の結果は、100発0中が当たり前なのです。
しかし、点予測の結果が独り歩きすることがあります。
可能であれば、幅を持った区間予測がいいでしょう。
人口推計
日本国政府は、日本の人口推計を実施しています。
人口統計学の手法である生命表(死亡表)などを活用し推計しています。詳細は、厚生労働省や国立社会保障・人口問題研究所のHP(http://www.ipss.go.jp/)などを参考にして頂ければと思います。
人口推計は、大災害など極端なことが起きない限り、比較的精度よく予測できます。
このような人口推計ですが、3×3の9つのシナリオから成り立っています。
3×3の9つのシナリオ
人口推計するには、出生し増える人口と、死亡し減る人口を推計する必要があります。
ビジネスであれば、顧客数を推計するのに、新規顧客数と離反顧客数を推計する、という感じになります。
人口推計するときに、3つのシナリオに沿って出生を推計します。
- 高位
- 中位
- 低位
死亡に関しても同様に、3つのシナリオに沿って推計します。
- 高位
- 中位
- 低位
要するに、出生と死亡についてそれぞれ高位・中位・低位の3仮定を設け、それらの組み合せにより9通りの推計を行っています。
これは日本国だけでなく、海外の国でも同様です(すべてかどうかは分かりません。シナリオの数も国によって変わります)。
さらに、国際人口移動のシナリオを考え組み合わせることあります。英国の政府保険数理局(GAD)では、国際人口移動のシナリオも高位・中位・低位の3仮定を設け、27シナリオで人口推計を行っています(少なくとも、私の知っている限りでは……)。
要するに、予測値に幅を持たせている、ということです。
総人口の推移:出生3仮定・死亡3仮定の比較
https://www8.cao.go.jp/shoushi/shoushika/meeting/priority/k_1/19html/sn_1_1_3.html
ちなみに、よく目にする人口推計の結果は、出生中位・死亡中位の結果です。
ポジもネガも3つのシナリオで予測しよう
先ほど、「ビジネスであれば、顧客数を推計するのに、新規顧客数と離反顧客数を推計する、という感じになる」というお話しをしました。
この場合ですと……
- 新規顧客数で高位・中位・低位の予測をする
- 離反顧客数で高位・中位・低位の予測をする
……ということです。そうすると、9つの顧客数の予測結果が手に入ります。
要するに、人口推計と同様、予測対象の要因を3つのシナリオ(高位・中位・低位)で予測し、それらを組み合わせ、幅を持たせて予測しようということです。
どこまで要因を分解するのか?
今、顧客数を推計するのに、新規顧客数と離反顧客数を推計する例をお話ししました。
このとき、売上を予測したい場合どうすればいいのでしょうか。
例えば、「売上=客単価×顧客数」で考えたとき……
- 客単価で高位・中位・低位の予測をする
- 顧客数で高位・中位・低位の予測をする
……ということになるでしょう。
この顧客数は……
- 新規顧客数で高位・中位・低位の予測をする
- 離反顧客数で高位・中位・低位の予測をする
……ということでしたので、27シナリオ(客単価3シナリオ×新規顧客3シナリオ×離反顧客3シナリオ)の売上予測の結果が手に入ります。
まとめると……
- 売上=客単価×顧客数
- 顧客数=前期顧客数+新規顧客数-離反顧客数
……となります。
どこまで要因を分解するのか? という問題が起こりますが、出来るだけ粒度が細かい方がいいですが、無意味に細かくしても仕方がないので、現場の人がコントロールし易い粒度がいいでしょう。
現実的には、データの粒度の壁が立ちはだかります。データの粒度の壁とは、手元にあるデータの粒度が粗いという壁です。そのときは、その壁の範囲内で考えていきます。
移動推計
人口推計では、国際人口移動のシナリオを考え組み合わせることあります、というお話しをしました。
ビジネスであれば、商品やサービスのラインナップやグレード間の移動が相当することでしょう。
一昔前、「いつかはクラウン。」というキャッチフレーズがありました。始まりはカローラで、そしてコロナを経て、いつかはクラウンという感じです。
ずーっとカローラを買い替え続ける人もいるでしょうが、上に位置付けられるクラウンに買い替える人もいることでしょう。
どのくらい移動するのかを推計するのが、移動推計です。
商品やサービスのラインナップやグレード間の移動を考慮すると、シナリオの数はどんどん増えて行きます。
3つもシナリオ作れないよぉー
3つもシナリオ作れないよぉー、という方もいるかもしれません。
ご安心ください。
統計学系のモデル(回帰モデルなど)は、予測区間(信頼区間とは別物)を推計することができます。
予測区間には幅がありますので……
- 高位:区間の上限(もしくは75パーセンタイル)
- 中位:区間の平均(もしくは50パーセンタイル、別名では中央値)
- 低位:区間の下限(もしくは25パーセンタイル)
……などとすることで、簡単に手にすることはできます。
今回のまとめ
今回は、「売上などの数値予測は少なくとも9つのシナリオで実施する」というお話しをしました。
ビジネスの現場で売上などの数値を予測することは多いでしょう。
予測対象域は未来のため、何かしら想定と言うかシナリオを考える必要もでてきます。
例えば人口推計などは、3(出生の高位・中位・低位シナリオ)×3(死亡の高位・中位・低位シナリオ)の9つのシナリオから成り立っています。
そうすることで、予測値に幅を持たせることができます。
ビジネスであれば、顧客数を推計するのに、新規顧客数と離反顧客数を3シナリオ(高位・中位・低位)ずつ推計する、という感じになります。
売上(=客単価×顧客数)を予測するのであれば、加えて客単価を3シナリオ(高位・中位・低位)で推定し、3×3×3の27シナリオで推計することになります。
どこまでどこまで要因を分解するのか? という問題はありますが、要因を分解すればするほど、予測対象が増えていきます。
3つもシナリオ作れないよぉー、という方もいるかもしれませんが、統計学系のモデル(回帰モデルなど)は予測区間(信頼区間とは別物)を推計することができ、この区間を使い高位・中位・低位の予測結果を出すことができます。
そもそも予測には、少なからず意思が介入しますし、予測モデルがすべての未来に対応できるように構築されているわけでもありません。最後に、人的な調整が入ることでしょう。