Pywedgeとは、Pythonの便利なライブラリーの1つです。主に以下のようなことができます。 データビジュアライゼーション(データの可視化) データの前処理支援 機械学習のベースラインモデルの作成支援 ノンコードでG...
Excelなどでセルに入っている数字を元に、セルを色分けしたり、棒グラフをセルの中に描いたりすることがります。 そのようなことを、pandasのデータフレームを、Jupyter Notebook上に表示させるときできない...
Caretは構築できる数理モデルが200種類を超え(2021年4月30日現在)、線形回帰モデルから、決定木系、ニューラルネット系と幅広いです。 前回は、Caretの概要とインストール、そして回帰問題を例に使い方を簡単に説...
scikit-learnなどで構築した機械学習モデル(オブジェクト)を、どのようにファイルに保存し、それを読み込み使うのか。 よくあるのが以下の2つです。 pickle:保存&読み込むスピードがjoblibより早い jo...
最近、機械学習系の数理モデルを構築する人も増えてきています。PythonですとScikit-Learn(sklearn)を使う人が多いようです。 では、Rではどうか? となりますが、Rで似たようなものですと、Caret(...
EDA(探索的データ分析)と称して、大量のグラフを作成し意味のあるグラフを探しながら見ていくという作業は、昔から行われてきました。 その作業が少しでも楽でにでもなれば、ということで Lux というPythonライブラリー...
Rでグラフ作成と言えば、ggplot2です。 ただ、ggplot2による可視化は綺麗だけど、その設定がちょっと面倒。もっとさくっとグラフ作成できなものだろうか。 と言うことで、パッケージ「ggplotgui」「esqui...
回帰問題や分類問題の予測モデルを構築するときに、色々なアルゴリズムで構築し比べたことがあるかと思います。 AutoML(自動機械学習)というわけではないですが、PythonのLazy Predictを使うと、1コードで色...
カテゴリカル変数は、数字で表現されているケースと、文字列で表現されているケースが多いです。 文字列で表現されているケースの場合、そのままモデル構築するとエラーが出ることも多いです。 そのような場合、文字列を数字にエンコー...
データ分析や予測モデル構築などをやってみたいが…… RやPythonだとの無料ツールはコーディングスキルがそれなりに必要になりハードルがある 有料ツールのSASやSPSSなどは使いやすそうだけど高額すぎる。 無料で使える...