第9回「AutoML【TPOT】のパイプラインに使われる関数一覧」で、TPOTのパイプライン(特徴量生成・予測)で使われる関数の概要を説明しました。 その中には、TPOT独自の関数がいくつかありました。 分類問題・回帰問...
前回、パイプラインの評価指標を一覧にしました。 実際にTPOTを使うときに、使いたい評価指標が実装されていないこともあると思います。 例えば回帰問題でよく使われるRMSE(Root Mean Squared Error、...
これまでの例では…… 分類問題:F値(f1) 回帰問題:決定係数(r2) ……でパイプラインを評価してきました。 今回は他にどのような評価指標があるか説明します。 なお、評価指標はTPOTClassifierとTPOTR...
TPOTは複数のパイプラインを構成し、評価します。 そのうち最も良いものを最適なパイプラインとして出力します。 人によっては、途中でどのようなパイプラインを構成し評価したのか、気になる方もいることでしょう。 実務的には、...
パイプラインは主に「前処理」「特徴量選択」「数理モデル」の3種類の関数で構成されます。 「前処理」「特徴量選択」「数理モデル」のすべての種類の関数が使われることもあれば、一部だけ使われることもあります。 パイプラインの処...
今回はTPOTと代表的な機械学習アルゴリズムであるRandomForestとの比較をしてみます。 もう少し説明すると、AutoML(自動機械学習)を活用し自動で構築した数理モデル(パイプライン含む)と、データセットに対し...
さて、TPOTは自動で特徴量生成と選択、モデル選択をしてくれます。 実際にどのような特徴量が作られ、どのモデルが使われたのか確認したいときがあります。 今回は、第3回で取り上げた分類問題を題材に、TPOTが生成した特徴量...
TPOTをはじめとした「自動機械学習」(AutoML)が実施するのは、以下の2点です。 変換器(特徴量の生成と選択)の生成 予測器(予測モデル)の生成 自動機械学習(AutoML)によっては、予測モデルの生成のみのものも...
第3回と第4回ではTPOTの基本的な動かし方を学びました。 ただし、これだけでは学習済モデルを使って別のデータを予測することができません。 TPOTで学習した数理モデルを他のプログラムで使う方法を説明します。 ここでは第...
TPOTは分類と回帰の問題を解くことができます。 前回の第3回は分類問題を扱いました。 今回は回帰問題に挑戦します。前回同様JupyterNotebookを使います説明しています。 回帰問題ですので、目的変数Yは…… 受...