データ分析・活用を推し進めるとき、ある段階まで進むと、予測モデルが1つのトピックとして登場します。
予測モデルとは、数式で表現されたもので、例えば受注や受注金額、離脱などを予測するためのものです。
当然ながら、予測モデルは天から降ってくるわけではありません。誰かが創造する必要があります。
当然ながら、予測モデルは創造しただけでは意味はありません。誰かが実務で活用する必要があります。
今回は、「予測モデルは、帰納的に構築し、演繹的に活用する。そしてアブダクション的」というお話しをします。
2つの予測モデルの用途
セールスアナリティクスにおける予測モデルの用途は、ざっくりいうと2つです。
- どの程度起こりそうかの予測(質的予測)
- どのくらいになりそうかの予測(量的予測)
「どの程度起こりそうかの予測」とは、例えば「受注なのか失注なのか」や「離脱なのか継続なのか」のように、どちらかの状態になりそうかを予測するものです。
受注予測モデルや離脱予測モデルなどです。
「どのくらいになりそうかの予測」とは、例えば「受注するなら金額はいくらのなりそうか」や「お店の売上高はどのくらいになりそうか」のように、量を予測するものです。
受注金額予測モデルや売上予測モデルなどです。
他にもあるかもしれませんが、ざっくりいうとどちらか2つに分類されることでしょう。
帰納法と演繹法
有名な論理展開の方法に、帰納法と演繹法というものがあります。
この2つは予測モデルを構築し活用する上で欠かせない概念で、帰納法と演繹法が正しいことが前提となっています。
帰納法とは、「個々の事実」の積み重ねから「普遍的な事実」(一般的な傾向、セオリー、ルールなど)を導き出し、結論に導く推論方法です。
例えば、色々な哺乳類を調べ、血が流れている事実を積み重ね、「哺乳類には血が流れている」という感じで結論付けます。
演繹法とは、「普遍的な事実」から、結論を導く推論方法です。
例えば、「ゴリラは哺乳類である」という「普遍的な事実」と、「哺乳類には血が流れている」という「普遍的な事実」から、「ゴリラには血が流れている」と結論付けます。
予測モデルは帰納的に構築する
予測モデルは、「個々の事実」である過去のデータから構築します。人が適当に数式を描くわけではありません。
つまり、予測モデルは帰納的に構築されます。
しかし、実はそうでもありません。例外もあります。
ベイズ系のモデルは、その典型です。人の主観がモデル構築に多少なりとも影響します。
そもそも、どの種類のモデルで予測モデルを構築するのかや、モデルを構築するときの学習パラメータの設定など、人が考え設定する必要があります。
そういう意味では、予測モデル構築は、帰納かつ演繹なのかもしれません。
ですが、予測モデル構築を大まかに見れば機能的です。
予測モデルは演繹的に活用する
予測モデルを活用するときは、そのモデルが正しいものとして活用します。
つまり、予測モデルは演繹的に活用されます。
しかし、正しいと思われたモデルが複数あることもあります。
どういうことかと言いますと、予測モデルを複数作る場合があり、各予測値が異なることがあるからです。
正しいはずの予測値がたくさんある、可笑しな状態です。
このような場合、複数の予測値の平均値と計算しそれを予測値としたり、複数の予測値で投票し最大得票を予測値と見なしたりします。
機械学習用語と表現すると、アンサンブル学習と呼ばれるやり方です。
「個々のモデルの予測値」の積み重ねから「今回の予測値」を導き出す、という感じとなり、帰納的な匂いがしてきます。
ですが、予測モデル活用を大まかに見れば演繹的です。
もう一つの論理展開「アブダクション」
有名な論理展開の方法に、帰納法と演繹法というものがありますが、それだけではありません。
もう一つ有名な論理展開があります。アブダクションです。
こちらの論理展開も、データ分析・活用上、非常に重要です。ここでは詳しくは説明しませんが、ベイズ統計学の世界と非常に近いです。
アブダクションとは、観測事実の生起要因の仮説を作り、論理的に説明するものです。
現在から過去を探ります。そういう意味で、予測とは逆になります。要因分析に近いかと思います。そういう意味で、データ分析・活用する上で非常に重要です。
予測モデルとの合わせ技として、予兆検知があげられます。未来の異常検知です。未来から現在(もしくは近い未来)を探るのです。
未来の異常を予測し、その未来の異常を起こす要因を探り対処する、このような使い方です。
例えば、プレディクティブ・メンテナンス(予知保全)やカスタマーヘルススコア(顧客健全性スコア)などの領域で、盛んに活用されています。
今回のまとめ
今回は、「予測モデルは、帰納的に構築し、演繹的に活用する。そしてアブダクション的」というお話しをしました。
有名な論理展開の方法に、帰納法と演繹法というものがあります。
帰納法とは、「個々の事実」の積み重ねから「普遍的な事実」(一般的な傾向、セオリー、ルールなど)を導き出し、結論に導く推論方法です。
まさに、予測モデル構築にあてはまります。
演繹法とは、「普遍的な事実」から、結論を導く推論方法です。
まさに、予測モデル活用にあてはまります。
帰納法と演繹法以外に、もう一つ有名な論理展開があります。アブダクションです。
現在から過去を探ります。そういう意味で、予測とは逆になります。要因分析に近いかと思います。
予測モデルとの合わせることで、未来から現在(もしくは近い未来)を探ることができます。予兆検知です。未来の異常検知です。
帰納法(インダクション)、演繹法(ディダクション)、アブダクションの3つの視点で、データ分析・活用を眺めて見ると、見えてくる世界が異なり、シンプルになるかもしれません。