データを溜めて見える化したのに上手くいかない!
色々な要因が考えられます。その中の一つが、データがきちんと蓄積されないというものがあります。
しかし、不思議なことに、データが綺麗にきちんと蓄積され、思い通りに見える化しているのに、データ活用が上手くいかないことがあります。
今回は、「なぜ見える化しても成果がでないのか? その解をSOR理論から探る」というお話しをします。
SR理論
SOR理論(Stimulus-Organism-Response Theory)に先立ち、行動心理学の世界では、SR理論(Stimulus-Response Theory)という考え方がありました。
- 刺激(S:Stimulus)
- 反応(R:Response)
行動を、刺激(S:Stimulus)に対する反応(R:Response)としてとらえたものです。
データ分析に馴染みのある方であれば、統計解析などのモデルで使われる「X(説明変数)」と「Y(目的変数)」の概念で、捉えた方が分かりやすいかもしれません。
- 刺激(S:Stimulus):X(説明変数)
- 反応(R:Response):Y(目的変数)
有名なところではパブロフ犬で有名な条件反射の実験でしょう。
実験の結果、犬にベルの音(X)という刺激を聞かせると、唾液(Y)を分泌するという反応が得られるようになりました。
ビジネス例では……
- 広告(X)を打てば売上(Y)が上がる
- 機器の稼働時間(X)が長くなると歩留まり(Y)が悪化する
……など色々と考えられそうです。
しかし、ここである問題が起こります。
それは、常にSRだけでは説明できない現象が多々起こったからです。
例えば、広告打ったからといってすべての人がその商品を購買するわけではありませんし、歩留まりが悪化するタイミングと稼働時間の関係が同じ機器でも状況によって異なってくるからです。
ビジネス系のデータサイエンス(統計モデリングなど)の世界では、異質性(heterogeneity)という言葉で表現され、数理モデルなどが構築されます。
SOR理論
SOR理論は、SR理論に「有機体(O:Organism)」という概念を付け加えたもので、心理学者のC.L.ハルが提唱しました。
「有機体(O:Organism)」とは人間であったり動物であったりします。SRだけでは説明できない現象を、「有機体(O:Organism)」という概念を導入することで説明できるようにした、という感じです。
「有機体(O:Organism)」をもう少し説明すると、行動心理学的には生物個体特有の内的要因(知覚、遺伝、性格、欲求など)で、個体によって異なってきます。AさんとBさんでは、性格や欲求が異なる、というものです。
このことが、同じ刺激(S:Stimulus)を与えても、有機体(O:Organism)が異なれば、異なる反応(R:Response)が返ってくる、という現象を説明できるようにしています。
例えば、人によって好き嫌いは異なりますし、慣れ親しんだものも異なります。そのような個人差があるため、同じ広告を見たからと言っても、その商品を買いたくなるかどうかは、人によって異なってきます。
ビジネス系のデータサイエンスの世界であれば、生物個体だけでなく、AIであったり装置であったり工場のラインなども付け加わります。
統計解析のモデルで語れば、同じX(説明変数)を与えても、個体によって、Y(目的変数)の値が変わる、ということです。
販売促進の例
簡単な例で説明します。
ある小売チェーンの販売促進の例です。
- 刺激(S:Stimulus):販売促進施策(折込チラシ、店頭POP、タイムセールなど)など
- 有機体(O:Organism):ターゲット顧客
- 反応(R:Response):来店、購入など
ターゲット顧客によって、効果のある販売促進施策が異なってきます。
例えば、総菜のタイムセールを実施したとき、10歳未満の女性、10代の女性と20代の女性、30代の女性、40代の女性、50代の女性、60代の女性、…… では反応は異なることでしょう。
例えば、折込チラシの目玉商品が1パック10円の生卵であったとき、卵アレルギーの人と、卵好きの人では、反応は異なるでしょう。
工場ラインの例
ある食品メーカーの工場ラインの例です。
- 刺激(S:Stimulus):製造条件、動線など
- 有機体(O:Organism):工場ライン
- 反応(R:Response):歩留、サイクルタイムなど
同じ製品を製造している全く同じ工場ラインでも、意外と歩留(製造した製品の良品率)が異なってきます。
例えば、日本の工場と中国の工場、タイの工場などで、同じ製造条件下で同じ製品を製造しても、歩留の状況は異なります。工員の熟練度や気候、機器のメンテナンス状況などが異なるからかもしれません。人的要素が大きいライン(手組がメインのラインなど)ほど、異なってきます。
3種類のデータと2種類の情報
どういった刺激を与えると、どのような反応が返ってくるのかは、本当のところは、実際にデータを取らなければ分かりません。
次の3種類のデータを蓄積することになります。
- 刺激(S:Stimulus)のデータ:X(説明変数)
- 有機体(O:Organism)のデータ
- 反応(R:Response)のデータ:Y(目的変数)
このようなデータ蓄積すると、例えば以下のような2種類の情報を得ることができます。
- レコメンド情報
- モニタリング情報
レコメンド情報とは、どのような「刺激(S:Stimulus)」をすべきかという情報です。
モニタリング情報とは、「刺激(S:Stimulus)」を与えた結果、どうなったのかという「反応(R:Response)」に関する情報です。通常「見える化」といった場合、こちらのモニタリング情報を指すことが多いようです。
「見える化」≒「モニタリング情報」になっていたらヤバい!
データを溜めて見える化したのに上手くいかない場合の大きな要因の一つに、見える化しているものが、実は「反応(R:Response)」に関する情報だけだった、というものがあります。
もちろん、「反応(R:Response)」に関する情報で、次のアクションが見えることもありますし、次のアクションを起こせることもあります。
どうせなら、次のアクションを示唆するレコメンド情報も提示してあげると、良いでしょう。
データ活用のちょっとした分類
X(説明変数)とY(目的変数)を使って、データ活用をいくつかに分類してみます。
- 今のYに着目
- モニタリング → 主にYの状況を日々確認
- 異常検知 → 確認しているYに異常が今起こっていないか評価
- 未来のYに着目
- 将来予測 → 今後Yがどうなりそうかを予測
- 予兆検知 → 異常が未来にどのくらい起こりそうかを評価
- 今までのXに着目
- 要因分析 → Xがどの程度Yに影響を与えそうかを評価
- あるべきXに着目
- 最適化 → 理想的なYになるためにはXはどうなるべきかを示唆
要は、「X:説明変数」と「Y:目的変数」のどちらに着目するのか、という違いと、どの時制(過去・今・未来)に着目するのか、ということです。
今回のまとめ
今回は、「なぜ見える化しても成果がでないのか? その解をSOR理論から探る」というお話しをしました。
SOR理論(Stimulus-Organism-Response Theory)とは、心理学者のC.L.ハルが提唱してもので、刺激(S:Stimulus)および有機体(O:Organism)、反応(R:Response)で構成される概念です。
統計解析のモデルっぽく言い換えると、X(説明変数)が刺激(S:Stimulus)で、Y(目的変数)が反応(R:Response)という感じになります。
データ活用といったとき、X(説明変数)に着目するのか、Y(目的変数)に着目するのか、ということは非常に重要です。
そして、データを溜めて見える化したのに上手くいかない場合の大きな要因の一つに、見える化しているものが、実は「反応(R:Response)」に関する情報だけだった、つまりY(目的変数)だけというものがあります。
このような情報を、モニタリング情報と言います。
しかし、人が行動するには、どうすればいいのかというX(説明変数)に関するレコメンド情報が必要です。
人や状況によっては、モニタリング情報だけでも動ける場合もありますが、どちらかと言うと稀です。どうせなら何をすべきかをズバッと示すレコメンド情報を示し、確実なアクションを導きましょう!
要するに、「見える化」≒「モニタリング情報」になっていたらヤバい! ということです。