これまでの例では…… 分類問題:F値(f1) 回帰問題:決定係数(r2) ……でパイプラインを評価してきました。 今回は他にどのような評価指標があるか説明します。 なお、評価指標はTPOTClassifierとTPOTR...
TPOTは複数のパイプラインを構成し、評価します。 そのうち最も良いものを最適なパイプラインとして出力します。 人によっては、途中でどのようなパイプラインを構成し評価したのか、気になる方もいることでしょう。 実務的には、...
BI(ビジネスインテリジェンス)ツールで先ずすべきは、外部にあるデータの読み込み(データ取得)です。 前回は、Excelからデータを読み込みデータ取得する方法について説明しました。 今回は、データベース「PostgreS...
パイプラインは主に「前処理」「特徴量選択」「数理モデル」の3種類の関数で構成されます。 「前処理」「特徴量選択」「数理モデル」のすべての種類の関数が使われることもあれば、一部だけ使われることもあります。 パイプラインの処...
今回はTPOTと代表的な機械学習アルゴリズムであるRandomForestとの比較をしてみます。 もう少し説明すると、AutoML(自動機械学習)を活用し自動で構築した数理モデル(パイプライン含む)と、データセットに対し...
さて、TPOTは自動で特徴量生成と選択、モデル選択をしてくれます。 実際にどのような特徴量が作られ、どのモデルが使われたのか確認したいときがあります。 今回は、第3回で取り上げた分類問題を題材に、TPOTが生成した特徴量...
前回までで、第1回「BI(ビジネスインテリジェンス)ツールとは何?」および第2回「Power BI Desktop のインストールのインストール方法」について説明しました。 BI(ビジネスインテリジェンス)ツールで先ずす...
TPOTをはじめとした「自動機械学習」(AutoML)が実施するのは、以下の2点です。 変換器(特徴量の生成と選択)の生成 予測器(予測モデル)の生成 自動機械学習(AutoML)によっては、予測モデルの生成のみのものも...
Power BI とは…… 様々なデータソースからデータを取得し 取得したデータを加工し レポートの作成し 共有する まで一貫して行うことのできる、Microsoft 社から提供されているBI(Business Inte...
第3回と第4回ではTPOTの基本的な動かし方を学びました。 ただし、これだけでは学習済モデルを使って別のデータを予測することができません。 TPOTで学習した数理モデルを他のプログラムで使う方法を説明します。 ここでは第...