第321話|2種類の時系列データ

第321話|2種類の時系列データ

時系列データといっても色々な形のものがあります。

よく見かけるのが次の2種類です。

  • 縦持ち時系列データ(時間軸が縦方向)
  • 横持ち時系列データ(時間軸が横方向)

基本となるのが、「縦持ち時系列データ」です。ビジネスの現場でよく見かけるのが「横持ち時系列データ」です。

縦持ち時系列データ」と「横持ち時系列データ」は、多くは相互に変換可能です。

今回は、「2種類の時系列データ」というお話しします。

縦持ち時系列データ(時間軸が縦方向)

縦持ち時系列データ」とは、ここまで例として登場した時系列データで、時間変数が1つ、指標変数が1つ以上あります。もちろん、時間変数や指標変数以外の変数があっても構いません。

次の例は、時間変数が「年月」(月単位)指標変数が「販売金額」(全体の販売金額の合計)で構成された「縦持ち時系列データ」です。

ビジネスの現場では、全体の販売金額だけでなく、商品や顧客、エリアなどに分けた販売金額にも関心を持つことでしょう。

このような場合、例えば次のように「商品別の変数」を設け時系列データを作ったりします。

このような時系列データは、ぱっと見では分かりやすいのですが、商品の種類が多いと、変数の数が非常に多くなるのが難点です。

では、顧客別の場合はどうでしょうか。

層別変数

商品別と同じように、「顧客別の変数」を設けるという方法もあります。

ただ、通常は非常に変数の数が非常に多くなります。顧客数が10万人であれば、10万変数になります。避けたいところです。

このような場合、顧客の数や商品の数、エリアの数だけ新しい変数を設けるのではなく、それぞれを1つの変数(例:顧客ID、商品コード、エリアNo)で表現し、縦に長いデータセットを準備するのがいいでしょう。

ここでは、このような変数を「層別変数」と呼ぶことにします。

基本のデータセット

この非常に縦に長い「縦持ち時系列データ」が、基本のデータセットになります。

このデータセットは集計や分析などを実施するとき非常に扱い易いです。必要に応じて、このデータセットの一部を切り出したり集計したりし、新たな「縦持ち時系列データ」を作り利用することができるからです。

さらに状況に応じて、この非常に縦に長い「縦持ち時系列データ」から、この後説明する「横持ち時系列データ」や別の記事で説明する「時系列特徴量付きテーブルデータ」を作り、活用することができます。

横持ち時系列データ(時間軸が横方向)

横持ち時系列データ」とは、変数で時間を表現したデータセットです。

例えば、次のように「2021年1月売上の変数」「2021年2月売上の変数」・・・といったものです。

厳密には違いますが、「横持ち時系列データ」は、ちょうど「縦持ち時系列データ」を転置(行と列を入れ替える)したかのようなデータセットになります。

横持ち時系列データ」の方が、「縦持ち時系列データ」よりも分かりやすいと感じる方も多いことでしょう。

そのためか、ビジネスの現場では「横持ち時系列データ」の方をよく見る気がします。

そこで、「縦持ち時系列データ」を作った方がいいのか、それとも「横持ち時系列データ」を作った方がいいのか悩むことがあります。

しかし、先ほどもお話ししましたが、基本となるのは「縦持ち時系列データ」です。時系列データを利用した集計や分析などを実施するとき、最初にすべきは、非常に縦に長い「縦持ち時系列データ」を作ることです。

今回のまとめ

今回は、「2種類の時系列データ」というお話ししました。

よく見かけるのが次の2種類です。

  • 縦持ち時系列データ(時間軸が縦方向)
  • 横持ち時系列データ(時間軸が横方向)

横持ち時系列データ」の方が、「縦持ち時系列データ」よりも分かりやすいと感じる方も多いことでしょう。そのためか、ビジネスの現場では「横持ち時系列データ」の方をよく見る気がします。

しかし、基本となるのが、「縦持ち時系列データ」です。必要に応じて、このデータセットの一部を切り出したり集計したりし、新たな「縦持ち時系列データ」を作り利用することができるからです。

さらに状況に応じて、この非常に縦に長い「縦持ち時系列データ」から、「横持ち時系列データ」を作り、活用することができます。

他に、「時系列特徴量付きテーブルデータ」というものもあります。「縦持ち時系列データ」をベースにテーブルデータ系のモデルを使えるようにしたもので、ビジネス活用上非常に使い勝手のいいものです。別途説明します。