データとドメイン(営業やマーケティング、生産、経営などの現場)を結びつけ、データサイエンスで成果を出したいなら、小さく始め大きく波及させるのが定石です。
いきなり大きく始めようとすると、なかなか上手く進みません。
と言うことで、「小さく始めよう!」となっても、思うように進められないかもしれません。例えば、小さく始めるためのテーマ設定で躓くかもしれません。
データ活用には……
- 個々の問題をデータを活用し解決するものと、
- 日常的なデータドリブンな状態を作るもの
……があります。
個々の問題をデータを活用し解決するための分析マネジメントフレームワークに、PPDACというものがあります。
最終的な目的が「日常的なデータドリブンな状態を作る」ことでも、最初はPPDACサイクルを使うと上手くいきます。
今回は、「小さくデータサイエンスを始めるならPPDACサイクル」というお話しをします。
Contents
PPDACサイクルとは
PPDACサイクルとは、1990年代に作られた問題解決のための分析マネジメントサイクルで、以下の5つからなります。
- P(Problem、課題設定)
- P(Plan、計画)
- D(Data、データ収集)
- A(Analysis、分析)
- C(Conclusion、とりあえずの結論)
このサイクルの優れているところは、実用的で誰でも使えることです。
小中学生がデータ分析を活用した問題解決力を身につけるための授業などでも使われています。
とりあえずの結論
PPDACサイクルはできるだけ、慎重に1回回すというよりも、気軽に(かつ、高速に)たくさん回します。
PPDACサイクルを1回転するたびに「とりあえずの結論(Conclusion)」を出し、結論を都度修正していきます
この「とりあえずの結論(Conclusion)」は関係者でレビューし、必要があれば何度でもPPDACサイクルを回していきます。
PPDACサイクルそのものに興味のある方は、「拙著(2015)『ロジカルデータ分析』 日経BP」を読んでいただければと思います。
問題は「どのテーマを選ぶのか」である
小さくデータサイエンスを始めるにしても、問題は「どのテーマを選ぶのか」になるかと思います。
例えば、次のようなアプローチ方法があります。
- ステップ1: とりあえずのテーマの設定
- ステップ1-1: 抱えている問題(困りごと)をもとにテーマ候補の洗い出し
- ステップ1-2: テーマ候補に対し今あるデータから何ができそうか検討
- ステップ1-3: テスト的に実務でトライアルできそうなテーマの決定
- ステップ2: テーマの今後の取り扱いの検討
- ステップ2-1: テスト的に実務でトライアル
- ステップ2-2: テーマの取り扱いの検討
- ステップ2-3: 小さく始めるテーマの決定
2つのPPDACサイクル
このアプローチの場合、例えば以下の2つのPPDACサイクルを回すことになります。
- 「ステップ1:とりあえずのテーマの設定」のためのPPDACサイクル
- 「ステップ2:テーマの今後の取り扱いの検討」のためのPPDACサイクル
簡単に説明します。
「ステップ1:とりあえずのテーマの設定」のためのPPDACサイクル
P(Problem、課題設定)
現場で抱えている問題(困りごと)から洗い出したテーマ候補の中から、筋のよさそうなテーマを課題として設定します。
As-Is(現状)アプローチとTo-Be(理想)の2つのアプローチがあります。
As-Is(現状)アプローチとは、先ず現状の困りごとを洗い出し、洗い出した困りごとに対し理想の状態を想像し問題点(As-IsとTo-Beのギャップ)を出していくやりかたです。
To-Be(理想)アプローチは、先ず理想の状態を定義し、理想と大きくかけ離れた現状から問題点(As-IsとTo-Beのギャップ)を出していくやりかたです。
問題点(As-IsとTo-Beのギャップ)から、筋のよさそうなテーマ(例:やり易く成果の大きそう)を課題として設定します。
P(Plan、計画)
筋のよさそうなテーマ(例:やり易く成果の大きそう)に対し、D(Data、データ収集)からA(Analysis、分析)、C(Conclusion、とりあえずの結論)までの計画を立てます。
今回のD(Data、データ収集)からA(Analysis、分析)、C(Conclusion、とりあえずの結論)までの計画だけでなく、データサイエンスが上手く運用に乗った状態(データドリブン営業やデータドリブンマーケティングなど)の、分析ストーリーや活用ストーリーといったその先のことまで計画します。
さらに、荒くてもいいので、テスト的な実務トライアルをする場合の計画もしておきます。
D(Data、データ収集)
テーマの課題解決に役立ちそうなデータを集め準備します。
場合によっては、現場にしかデータが無かったり(例:担当者のPCや現場のサーバーにしかない)、他社にお願いするケースもでてきます。
さらに、今回の分析のために、簡易的にデータ収集を新たに実施する必要もでてきます。
A(Analysis、分析)
テーマとして成り立ちそうかを検討するために、集めたデータに対し、データ分析や数理モデル構築などを実施します。
想像とは異なる発見が色々でてきます。
C(Conclusion、とりあえずの結論)
データ分析や数理モデル構築した結果をもとに、現状のデータで何ができそうか、どのようなデータがあればよさそうか、必要なデータはすぐに集めそうか、などを検討します。
結論例として、テスト的に実務でトライアルできそうなテーマである、データがもう少し溜まってから検討し直す、新たに筋のよさそうなテーマが発見された、など。
「ステップ2:テーマの今後の取り扱いの検討」のためのPPDACサイクル
P(Problem、課題設定)
※「ステップ1:とりあえずのテーマの設定」のためのPPDACサイクルの「C(Conclusion、とりあえずの結論)」
P(Plan、計画)
テスト的に実務でトライアルするための実施計画や、どのような情報(定量的なデータや定性的な情報など)を収集するのか計画します。
このとき、検討時の評価基準の設計(成果の大きさ、やり易さ、など)も併せてします。
D(Data、データ収集)
テスト的に実務でトライアルし、単に発生したデータだけでなく、定性的な情報も併せて集めます。
A(Analysis、分析)
テーマの取り扱いを今後どうすべきかを検討するために、情報(定量的なデータや定性的な情報など)や評価基準(成果の大きさ、やり易さ、など)をもとに分析します。
C(Conclusion、とりあえずの結論)
テーマの取り扱いを今後どうすべきかを検討し結論をだします。
結論例として、とりあえず小さく始めてみるテーマ、データ収集からはじめるべきテーマ、再度トライアル実施してみるテーマなど、など。
期間
経験値ですが、ステップ1で約2ヶ月~3ヶ月かかります。
ステップ2は、テスト的な実務トライアルの期間の長さによって異なります。短いものだと1日、長いものだと1年近くかかりものもあります。
テスト的な実務トライアルの期間の長くかかる場合には、ステップ2が小さく始めたデータサイエンスの第一歩と見なしもいいかもしれません。
今回のまとめ
今回は、「小さくデータサイエンスを始めるならPPDACサイクル」というお話しをしました。
小さく始めるのしても、例えばテーマ設定などの壁があります。
このようなとき、問題解決のための分析マネジメントサイクルPPDACを使うと、上手くいきます。
- P(Problem、課題設定)
- P(Plan、計画)
- D(Data、データ収集)
- A(Analysis、分析)
- C(Conclusion、とりあえずの結論)
以下のステップ1とステップ2でPPDACを利用します。
- ステップ1: とりあえずのテーマの設定
- ステップ1-1: 抱えている問題(困りごと)をもとにテーマ候補の洗い出し
- ステップ1-2: テーマ候補に対し今あるデータから何ができそうか検討
- ステップ1-3: テスト的に実務でトライアルできそうなテーマの決定
- ステップ2: テーマの今後の取り扱いの検討
- ステップ2-1: テスト的に実務でトライアル
- ステップ2-2: テーマの取り扱いの検討
- ステップ2-3: 小さく始めるテーマの決定
このサイクルの優れているところは、実用的で誰でも使えることです。
テーマ設定などの躓いている場合、ぜひチャレンジしてみてください。