色々な特徴量選択(feature selection)の方法があります。 よくあるやり方としては…… 分散や共分散を元に特徴量(説明変数)を削る方法 モデルへの影響を考慮しながら特徴量(説明変数)を削る方法 ……などなど...
H2O(エイチツーオー)は、H2O.ai社によって開発された、インメモリ型の機械学習プラットフォームです。 教師あり学習や教師なし学習などの機械学習系の数理モデルを構築することができます。 嬉しいのが、ノンコードで機械学...
前回は、Pywedge を使ったお手軽データビジュアライゼーション(データの可視化)について簡単に説明しました。 Python Pywedge を使ったお手軽データビジュアライゼーション(データの可視化) Pywedge...
Pywedgeとは、Pythonの便利なライブラリーの1つです。主に以下のようなことができます。 データビジュアライゼーション(データの可視化) データの前処理支援 機械学習のベースラインモデルの作成支援 ノンコードでG...
Excelなどでセルに入っている数字を元に、セルを色分けしたり、棒グラフをセルの中に描いたりすることがります。 そのようなことを、pandasのデータフレームを、Jupyter Notebook上に表示させるときできない...
Caretは構築できる数理モデルが200種類を超え(2021年4月30日現在)、線形回帰モデルから、決定木系、ニューラルネット系と幅広いです。 前回は、Caretの概要とインストール、そして回帰問題を例に使い方を簡単に説...
scikit-learnなどで構築した機械学習モデル(オブジェクト)を、どのようにファイルに保存し、それを読み込み使うのか。 よくあるのが以下の2つです。 pickle:保存&読み込むスピードがjoblibより早い jo...
最近、機械学習系の数理モデルを構築する人も増えてきています。PythonですとScikit-Learn(sklearn)を使う人が多いようです。 では、Rではどうか? となりますが、Rで似たようなものですと、Caret(...
EDA(探索的データ分析)と称して、大量のグラフを作成し意味のあるグラフを探しながら見ていくという作業は、昔から行われてきました。 その作業が少しでも楽でにでもなれば、ということで Lux というPythonライブラリー...
Rでグラフ作成と言えば、ggplot2です。 ただ、ggplot2による可視化は綺麗だけど、その設定がちょっと面倒。もっとさくっとグラフ作成できなものだろうか。 と言うことで、パッケージ「ggplotgui」「esqui...