今回は、ゆるいお話しです。
データ分析をするとき、色々なフレームワークがあります。その中で、比較的使いやすいのが「XYZフレームワーク」です。
理由は、簡単でシンプルだからです。
今回は、「SOR理論とデータ分析の『XYZフレームワーク』」というお話しをします。
Contents
SR理論から考えるデータ分析
行動心理学の世界では、SR理論(Stimulus-Response Theory)という考え方があります。
行動を、「刺激」(S:Stimulus)に対する「反応」(R:Response)としてとらえたものです。
データ分析の枠組みで語ると、「X(説明変数)」と「Y(目的変数)」の概念で捉えることができます。
- 刺激(S:Stimulus):X(説明変数)
- 反応(R:Response):Y(目的変数)
SR理論の概念はデータ活用を考える上で幅広く使え……
- 広告(X)を打てば売上(Y)が上がる
- 機器の稼働時間(X)が長くなると歩留まり(Y)が悪化する
……など、色々と応用できそうです。
しかし、ここである問題が起こります。
ある問題
それは、「同じ刺激(S:Stimulus)に対し、常に同じ反応(R:Response)が起こるわけではない」という問題です。
例えば、広告打ったからといって、すべての人がその商品を購買するわけではありません。その人がどのような人なのかに依存します。
例えば、稼働時間と歩留まりが悪化するタイミングの関係は、すべての工場で同じではありません。その日の気温や湿度、工員の熟練度などに依存します。
SOR理論から考えるデータ分析
SR理論に「有機体(O:Organism)」という概念を付け加えたSOR理論(Stimulus-Organism-Response Theory)というものがあります。
「有機体(O:Organism)」とは人間であったり動物であったりします。
刺激(S:Stimulus)に対する反応(R:Response)だけでは説明できない現象を、「有機体(O:Organism)」という概念を導入することで説明できるようにした、という感じです。
データ分析は「XYZフレームワーク」で整理しよう
ビジネス系のデータ分析の世界であれば、「有機体(O:Organism)」は生物個体だけでなく、AIであったり装置であったり工場のラインなど生物以外も付け加わります。
つまり、同じX(説明変数)を与えても、個人の属性や工場の状況などによって、Y(目的変数)の値が変わる、ということです。
- 刺激(S:Stimulus):X(説明変数)
- 有機体(O:Organism):Z(調整変数 or 説明変数)
- 反応(R:Response):Y(目的変数)
調整変数
ここでは「YとXの関係はZによって変化する」ということを表現するために調整変数という概念を使います。
例えば、「広告」(X)と「購買」(Y)の関係性は「個人属性」(Z)によって異なる、「工場の稼働時間」(X)と「歩留まり悪化のタイミング」(Y)の関係性は「天候(気温や湿度など)」(Z)によって異なる、といった感じです。
調整変数は、説明変数と一緒くたに扱うこともありますが、意識的に区別しておいた方がいいでしょう。
モニタリング情報とレコメンド情報
XYZの3種類(説明変数X・調整変数Z・目的変数Y)のデータを分析することで、例えば以下のような2種類の情報を得ることができます。
- レコメンド情報
- モニタリング情報
レコメンド情報とは、どのような「刺激(S:Stimulus)」(アクションなど)をすべきか、という情報です。
モニタリング情報とは、「刺激(S:Stimulus)」を与えた結果、どうなったのかという「反応(R:Response)」に関する情報です。通常「見える化」といった場合、こちらのモニタリング情報を指すことが多いです。
問題なのは、「反応(R:Response)」に関するデータだけを集めてしまい、そのデータを集計しモニタリング情報として現場に提供するケースです。
どのような問題が起こるのか?
例えば、「売上が悪化した」とか、「生産の歩留まり(良品の割合)が悪化した」という結果だけ見せられても、具体的に何をするのがいいのかは、ベテランか相当センスの良い方でないと見えこないことでしょう。
そのため、アクションの結果である「モニタリング情報」を現場に提供するとともに、何をすべきかという「レコメンド情報」も併せて現場に提供したほうがいいでしょう。
この2種類の情報(レコメンド情報とモニタリング情報)を「見える化」するためには、この2種類の情報(レコメンド情報とモニタリング情報)を生み出す必要があります。
それが、データ分析です。
この2種類の情報(レコメンド情報とモニタリング情報)を、何かしらのデータ分析を実施することで生み出し、そして現場に提供しより良いアクションに繋げます。
今回のまとめ
今回は、「SOR理論とデータ分析の『XYZフレームワーク』」というお話しをしました。
データ分析をするとき、色々なフレームワークがあります。
その中で、比較的使いやすいのが「XYZフレームワーク」です。
理由は、簡単でシンプルだからです。
次の3つの観点でデータを整理し、データ分析を進めていきます。
- 刺激(S:Stimulus):X(説明変数)
- 有機体(O:Organism):Z(調整変数 or 説明変数)
- 反応(R:Response):Y(目的変数)
データ分析で煮詰まったときに、一度「XYZフレームワーク」で整理してみてはいかがでしょうか。
とは言え、具体的に「XYZフレームワーク」を使い、どのように集計し分析しモデルを構築していくのか、というお話しがありますが、そこは別の機会にお話しします。