今回はTPOTと代表的な機械学習アルゴリズムであるRandomForestとの比較をしてみます。 もう少し説明すると、AutoML(自動機械学習)を活用し自動で構築した数理モデル(パイプライン含む)と、データセットに対し...
単純な売上データも、ウェブサイトのアクセス状況も、工場などのセンサーから収集すされるデータも、時系列データです。 多くのビジネスの現場で発生するデータは、「時間軸」の概念の付与された時系列データです。 ビジネスの現場でデ...
予算などの計画値を考えるとき、前年と同じや前年比1.1倍みたいな立て方がたまにあります。 例えば…… 前年これぐらい使っているから、来年も前年と同じぐらいでいこう! 前年よりも売上を伸ばしたいから、今年は前年比1.1倍ぐ...
さて、TPOTは自動で特徴量生成と選択、モデル選択をしてくれます。 実際にどのような特徴量が作られ、どのモデルが使われたのか確認したいときがあります。 今回は、第3回で取り上げた分類問題を題材に、TPOTが生成した特徴量...
前回までで、第1回「BI(ビジネスインテリジェンス)ツールとは何?」および第2回「Power BI Desktop のインストールのインストール方法」について説明しました。 BI(ビジネスインテリジェンス)ツールで先ずす...
最近のデータ分析やモデル構築では、「予測を当てればいい!」という風潮もありますが、確かに当てるだけであれば、それで問題ないでしょう。 画像処理などの世界では、それでいいかもしれません。 ただ、ビジネス系のデータ分析の場合...
TPOTをはじめとした「自動機械学習」(AutoML)が実施するのは、以下の2点です。 変換器(特徴量の生成と選択)の生成 予測器(予測モデル)の生成 自動機械学習(AutoML)によっては、予測モデルの生成のみのものも...
最もシンプルなデータ活用の1つがABテストです。 A案とB案のどちらがいいのかをデータで判断する、という感じのデータ分析・活用(データサイエンス実践)です。 この地味な、データ分析・活用(データサイエンス実践)は、明日か...
Power BI とは…… 様々なデータソースからデータを取得し 取得したデータを加工し レポートの作成し 共有する まで一貫して行うことのできる、Microsoft 社から提供されているBI(Business Inte...
機械学習で構築した数理モデルが、ブラックボックス化するケースは少なくありません。 そのような中、最近よく聞くキーワードに「XAI」というものがあります。 XAIとは「Explainable Artificial Inte...
第3回と第4回ではTPOTの基本的な動かし方を学びました。 ただし、これだけでは学習済モデルを使って別のデータを予測することができません。 TPOTで学習した数理モデルを他のプログラムで使う方法を説明します。 ここでは第...
最近、BI(ビジネスインテリジェンス)ツールを導入する企業が増えています。 BIツールそのものは昔からありますが、最近ではTableauやQlik Sense、Power BIなどが有名です。Power BI Deskt...
ここ数年、色々なAutoML(自動機械学習)が登場してきました。 有料版で勢いがあるのがDataRobotです。GoogleもIBMもMicrosoftなどでもAutoMLサービスを提供しています。 国内でもSONYのP...
あなたはデータを活用し、利益を生み出しつづけていますか? どうであろうかと思われた方は、財務諸表を見るといいでしょう。 財務諸表と聞くと大げさな感じがしますが、要は売上や利益、コストなどを見るといいということです。 上手...
TPOTは分類と回帰の問題を解くことができます。 前回の第3回は分類問題を扱いました。 今回は回帰問題に挑戦します。前回同様JupyterNotebookを使います説明しています。 回帰問題ですので、目的変数Yは…… 受...
せっかく、データ集計したり分析したり、予測モデルを作って予測値をアウトプットしても、現場で活用されないことは多々あります。 現場でのデータ活用の可能性の高め方は、色々なやり方があります。 その中で、私が最重要だと感じてい...