第139話|データ活用で肝となるモデルは、予測モデルや異常検知などの数理モデルだけではない

第139話|データ活用で肝となるモデルは、予測モデルや異常検知などの数理モデルだけではない

モデルと聞くと、何を思い浮かべるでしょうか?

データサイエンスなどに馴染みのある方であれば、予測モデルや異常検知などの数理モデルなどを思い浮かべることでしょう。

データサイエンスを実践するとき、つまりデータ分析を実務で活用するとき、予測モデルや異常検知などの数理モデル以外のモデルも必要になります。

今回は、「データ活用で肝となるモデルは、予測モデルや異常検知などの数理モデルだけではない」というお話しをします。

モデル

データサイエンスなどに馴染みのある方であれば、予測モデルや異常検知などの数理モデルなどを思い浮かべる人が多いと思います。

しかし、データサイエンスなどに馴染みのない方であれば、ファッションモデルやプラモデルを思い浮かべる人も、多いと思います。

他にも、データモデルやビジネスモデル、プロセスモデルなど、モデルと名の付くものが世の中には多々あります。

モデルの辞書的な意味

辞書をひいてみると、モデルの意味は、次のようになっています。

1 模範・手本または標準となるもの。また、今後の範とするために試みられたもの。「緑化モデル地区」「モデルスクール」
2 模型。また、展示用の見本。「プラスチックモデル」
3 ある事象について、諸要素とそれら相互の関係を定式化して表したもの。「計量経済モデル」
4 美術家・写真家が制作の対象とする人や物。「ヌードモデル」
5 小説・戯曲などの題材となった実在の人や事件。「モデル小説」
6 「ファッションモデル」の略。
7 機械・自動車などの型式(かたしき)。型。「ニューモデル」

引用元:デジタル大辞泉

 

① 自動車や機械などの型式かたしき。 「九六年型のニュー━-」
② 模型。 「 - ━ガン」
③ 商品や事柄の標準となるもの。模範。手本。見本。 「 -地区」
④ 画家・彫刻家・写真家などが、製作のとき対象として使う人物。 「画家の-になる」 「ヌード━-」
⑤ 小説・戯曲などに描かれる人物の素材になった実在の人。
⑥ ファッション━モデルの略。
⑦ 問題とする事象(対象や諸関係)を模倣し、類比・単純化したもの。また、事象の構造を抽象して論理的に形式化したもの。

引用元:大辞林 第三版

データサイエンス実践(ビジネス活用)的なモデルの定義

データサイエンスを実践するとき、つまりデータ分析を実務で活用するときのモデルは、デジタル大辞泉であれば「3」、大辞林 第三版であれば「⑦」に近いです。

  • 3 ある事象について、諸要素とそれら相互の関係を定式化して表したもの。「計量経済モデル」(引用元:デジタル大辞泉)
  • ⑦ 問題とする事象(対象や諸関係)を模倣し、類比・単純化したもの。また、事象の構造を抽象して論理的に形式化したもの(引用元:大辞林 第三版)

個人的には、以下の定義が一番しっくりきます。

モデルとは、ある人間にとっての、ある状況、あるいは状況についての概念(idea) の明示的な解釈(explicit interpretation) である。

モデルは、数式、記号、あるいは言葉で表すことができるが、本質的には、実体、プロセス、属性、およびそれらの関係についての記述(description)である。

引用元:Brian Wilson 著・根来 竜之監訳「システム仕様の分析学―ソフトシステム方法論― 」共立出版(1996年1月)

私なりに表現すると、「モデルとは、現実世界を模したもので、何かしらの記号(数式や図など)で表現されたもの」となります。

ポイントは……

  • 現実世界を模したもの
  • 記号(数式や図など)で表現されたもの

……です。

数理モデル

例えば、統計解析や機械学習などで登場する数理モデルは、数式という記号でモデルを表現しています。

数式で表現された数理モデルは、あくまでも現実世界を模したもので、本物ではありません。

したがって、「数理モデルとは、現実世界を模したもので、数式という記号で表現されたもの」となります。

数理モデル以外のモデルには何がある?

データサイエンス実践(ビジネス活用)という立ち位置で考えると、数理モデル以外にも必要となるモデルがあります。

例えば……

  • プロセスモデル(分析プロセスや活用プロセスなど)
  • モックアップ(レポートやダッシュボードの雛形)
  • データモデル(DBの雛形)
  • ビジネスモデル(収益を上げるための仕組みなど)

……あたりでしょうか。少なくとも、上位2つ(もしくは上位1つ)は必須でしょう。

共通しているのは、表現するときに数式化したり図式化したり、何かしらの記号で表現することでしょう。

当然ですが、現実世界そのものではなく、あくまでも現実世界を単純化し模倣したものです。

2種類のモデル

モデルには大きく2種類あります。

  • 今現在の現実世界を表現した「As-Isモデル」(典型モデルや近似モデル)
  • こうあるべき現実世界を表現した「To-Beモデル」(理想モデルや規範モデル)

例えば、今現在の業務フローを図示化すれば、それは「As-Isモデル」型のプロセスモデルで、あるべき業務フローを図示化すれば、それは「To-Beモデル」型のプロセスモデルになります。

どちらも現実世界を模したもので、意味づけ(理想か現状か)が異なるだけです。

今回のまとめ

今回は、「データ活用で肝となるモデルは、予測モデルや異常検知などの数理モデルだけではない」というお話しをしました。

どうしても、データサイエンスやデータ分析、機械学習というものに慣れ親しんでくると、モデルと聞くと数理モデルをイメージしてしまい、世間とズレてきます。

モデルという概念には、色々な意味があり、数理モデルだけがモデルではありません。

ファッションモデルやプラモデルもモデルです。

データサイエンス実践(ビジネス活用)という立ち位置で考えると、どうでしょうか?

データサイエンスやデータ分析、機械学習などを活用しようとするとき、数理モデルだけが必要なのではありません。他のモデルも必要になります。

例えば、以下です。

  • プロセスモデル(分析プロセスや活用プロセスなど)
  • モックアップ(レポートやダッシュボードの雛形)

場合によっては、以下も必要になります。

  • データモデル(DBの雛形)
  • ビジネスモデル(収益を上げるための仕組みなど)

モデルとは、現実世界を模したもので、何かしらの記号(数式や図など)で表現されたものです。

データサイエンス実践(ビジネス活用)を考えたとき、構築すべきモデルに抜け漏れがないか、確認してみることをお薦めします。