第120話|予測モデルは、帰納的に構築し、演繹的に活用する。そしてアブダクション的

第120話|予測モデルは、帰納的に構築し、演繹的に活用する。そしてアブダクション的

データ分析・活用を推し進めるとき、ある段階まで進むと、予測モデルが1つのトピックとして登場します。

予測モデルとは、数式で表現されたもので、例えば受注や受注金額、離脱などを予測するためのものです。

当然ながら、予測モデルは天から降ってくるわけではありません。誰かが創造する必要があります。

当然ながら、予測モデルは創造しただけでは意味はありません。誰かが実務で活用する必要があります。

今回は、「予測モデルは、帰納的に構築し、演繹的に活用する。そしてアブダクション的」というお話しをします。

2つの予測モデルの用途

セールスアナリティクスにおける予測モデルの用途は、ざっくりいうと2つです。

  • どの程度起こりそうかの予測(質的予測)
  • どのくらいになりそうかの予測(量的予測)

どの程度起こりそうかの予測」とは、例えば「受注なのか失注なのか」や「離脱なのか継続なのか」のように、どちらかの状態になりそうかを予測するものです。

受注予測モデル離脱予測モデルなどです。

どのくらいになりそうかの予測」とは、例えば「受注するなら金額はいくらのなりそうか」や「お店の売上高はどのくらいになりそうか」のように、量を予測するものです。

受注金額予測モデル売上予測モデルなどです。

他にもあるかもしれませんが、ざっくりいうとどちらか2つに分類されることでしょう。

帰納法と演繹法

有名な論理展開の方法に、帰納法と演繹法というものがあります。

この2つは予測モデルを構築し活用する上で欠かせない概念で、帰納法と演繹法が正しいことが前提となっています。

帰納法とは、「個々の事実」の積み重ねから「普遍的な事実」(一般的な傾向、セオリー、ルールなど)を導き出し、結論に導く推論方法です。

例えば、色々な哺乳類を調べ、血が流れている事実を積み重ね、「哺乳類には血が流れている」という感じで結論付けます。

演繹法とは、「普遍的な事実」から、結論を導く推論方法です。

例えば、「ゴリラは哺乳類である」という「普遍的な事実」と、「哺乳類には血が流れている」という「普遍的な事実」から、「ゴリラには血が流れている」と結論付けます。

予測モデルは帰納的に構築する

予測モデルは、「個々の事実」である過去のデータから構築します。人が適当に数式を描くわけではありません。

つまり、予測モデルは帰納的に構築されます。

しかし、実はそうでもありません。例外もあります。

ベイズ系のモデルは、その典型です。人の主観がモデル構築に多少なりとも影響します。

そもそも、どの種類のモデルで予測モデルを構築するのかや、モデルを構築するときの学習パラメータの設定など、人が考え設定する必要があります。

そういう意味では、予測モデル構築は、帰納かつ演繹なのかもしれません。

ですが、予測モデル構築を大まかに見れば機能的です。

予測モデルは演繹的に活用する

予測モデルを活用するときは、そのモデルが正しいものとして活用します。

つまり、予測モデルは演繹的に活用されます。

しかし、正しいと思われたモデルが複数あることもあります。

どういうことかと言いますと、予測モデルを複数作る場合があり、各予測値が異なることがあるからです。

正しいはずの予測値がたくさんある、可笑しな状態です。

このような場合、複数の予測値の平均値と計算しそれを予測値としたり、複数の予測値で投票し最大得票を予測値と見なしたりします。

機械学習用語と表現すると、アンサンブル学習と呼ばれるやり方です。

「個々のモデルの予測値」の積み重ねから「今回の予測値」を導き出す、という感じとなり、帰納的な匂いがしてきます。

ですが、予測モデル活用を大まかに見れば演繹的です。

もう一つの論理展開「アブダクション」

有名な論理展開の方法に、帰納法と演繹法というものがありますが、それだけではありません。

もう一つ有名な論理展開があります。アブダクションです。

こちらの論理展開も、データ分析・活用上、非常に重要です。ここでは詳しくは説明しませんが、ベイズ統計学の世界と非常に近いです。

アブダクションとは、観測事実の生起要因の仮説を作り、論理的に説明するものです。

現在から過去を探ります。そういう意味で、予測とは逆になります。要因分析に近いかと思います。そういう意味で、データ分析・活用する上で非常に重要です。

予測モデルとの合わせ技として、予兆検知があげられます。未来の異常検知です。未来から現在(もしくは近い未来)を探るのです。

未来の異常を予測し、その未来の異常を起こす要因を探り対処する、このような使い方です。

例えば、プレディクティブ・メンテナンス(予知保全)やカスタマーヘルススコア(顧客健全性スコア)などの領域で、盛んに活用されています。

今回のまとめ

今回は、「予測モデルは、帰納的に構築し、演繹的に活用する。そしてアブダクション的」というお話しをしました。

有名な論理展開の方法に、帰納法と演繹法というものがあります。

帰納法とは、「個々の事実」の積み重ねから「普遍的な事実」(一般的な傾向、セオリー、ルールなど)を導き出し、結論に導く推論方法です。

まさに、予測モデル構築にあてはまります。

演繹法とは、「普遍的な事実」から、結論を導く推論方法です。

まさに、予測モデル活用にあてはまります。

帰納法と演繹法以外に、もう一つ有名な論理展開があります。アブダクションです。

現在から過去を探ります。そういう意味で、予測とは逆になります。要因分析に近いかと思います。

予測モデルとの合わせることで、未来から現在(もしくは近い未来)を探ることができます。予兆検知です。未来の異常検知です。

帰納法(インダクション)演繹法(ディダクション)アブダクションの3つの視点で、データ分析・活用を眺めて見ると、見えてくる世界が異なり、シンプルになるかもしれません。