ビジネスの世界の多くのデータは、時間的概念の紐づいた時系列データです。売上データやセンサーデータなどが、その典型例です。 時系列データの1つの用途として、予測というものがあります。 時系列系の予測モデルを構築できるPyt...
データを入手したとき、先ずすべきは探索的データ分析(EDA)です。 この探索的データ分析(EDA)で必ず実施するのが、データビジュアライゼーションです。 要は、グラフやチャートなどを作成し、データの特徴や関係性などを見え...
データ分析で遊ぶとき、何かサンプルとなるデータセットはないか、探すこともあることでしょう。 そのとき重宝するのが、OpenMLのサンプルデータです。 Pythonですと、Scikit-learnの関数「sklearn.d...
特徴量選択(変数選択)は、機械学習系の予測モデルなどを構築するとき、最初に行う重要なステップの1つです。 予測に寄与しない特徴量(説明変数)を取り除くことで、よりシンプルな予測モデルを構築を目指します。 色々な考え方や手...
売上などの時系列データを予測するモデルは、基本となるのは1期先予測(1-Step ahead prediction)ですが、実務では複数先予測(Multi-Step ahead prediction)が求められます。 ニ...
売上などの時系列データを予測するモデルは、基本となるのは1期先予測(1-Step ahead prediction)ですが、実務では複数先予測(Multi-Step ahead prediction)が求められます。 ニ...
売上などの時系列データを予測するモデルは、基本となるのは1期先予測(1-Step ahead prediction)ですが、実務では複数先予測(Multi-Step ahead prediction)が求められます。 ニ...
PythonにはWindows上では動かないライブラリー(パッケージ)があります。 いつも使いなれたWindows上で、それらのライブラリー(パッケージ)が使えると非常に嬉しいことでしょう。 Windowsには、マイクロ...
jupyterthemesで、Jupyterのテーマなどを変更することができます。 jupyter-themes https://github.com/dunovank/jupyter-themes 単にテーマだけを変更...
Pandasは非常に優れたライブラリーで、データフレームに対し色々なことができます。ただ、すべての機能を知り使いこなすのは至難の業です。 幸運なことに、よく利用する機能は決まっており(人によって違いとは思いますが……)、...