H2Oは、PythonやR、その他多数のプラットフォームで動きます。 前回は、H2O AutoML とは何なのか、というお話しをしました。 H2O AutoML とは? 今回は、WindowsのRにH2Oをインストールす...
議論や報告書などで…… 何かしらの事実(ファクト)を元にしているのか 予測した結果(もしくは推論した結果)から導き出したものなのか、 単なる感想なのか ……よく分からないことがあります。 受け手(聞き手や読み手など)は、...
H2Oは、PythonやR、その他多数のプラットフォームで動きます。 前回は、H2O AutoML とは何なのか、というお話しをしました。 H2O AutoML とは? 今回は、WindowsのPythonにH2Oをイン...
色々な特徴量選択(feature selection)の方法があります。 よくあるやり方としては…… 分散や共分散を元に特徴量(説明変数)を削る方法 モデルへの影響を考慮しながら特徴量(説明変数)を削る方法 ……などなど...
人は変化を嫌がるものです。 人体は、環境変化に対し身体の状態を一定に保つ働きがあり、ホメオスタシス(恒常性維持)と呼ばれています。気温が上がれば発汗作用を起こし体温上昇を押さえます。 同様のことが心理面でもあり、今のやり...
データ活用と相性がいいのは、既存の何かをより良くする(楽にする)ことです。 既にあるビジネス(事業)に対し、新規顧客の獲得・既存顧客の離反阻止・既存顧客のLTV拡大・業務効率化・生産性向上・コストダウンなどなど。 データ...
H2O(エイチツーオー)は、H2O.ai社によって開発された、インメモリ型の機械学習プラットフォームです。 教師あり学習や教師なし学習などの機械学習系の数理モデルを構築することができます。 嬉しいのが、ノンコードで機械学...
面倒な特徴量エンジニアリングやモデル選択、モデルのパラメータ調整などを全自動で実施してくれるAutoML(自動機械学習)が最近発達してきています。 自動機械学習(AutoML) Web講座の前シリーズでは、主にPytho...
前回は、Pywedge を使ったお手軽データビジュアライゼーション(データの可視化)について簡単に説明しました。 Python Pywedge を使ったお手軽データビジュアライゼーション(データの可視化) Pywedge...
DX(デジタルトランスフォーメーション)、AI(人工知能)、ML(機械学習)、DS(データサイエンス)などなど。 どんなにカッコいいワードで表現しようが、データを活用し成果を出すのは現場です。 現場無視でデータ活用を企画...
Pywedgeとは、Pythonの便利なライブラリーの1つです。主に以下のようなことができます。 データビジュアライゼーション(データの可視化) データの前処理支援 機械学習のベースラインモデルの作成支援 ノンコードでG...
データを集めたら、次にデータを分析しなければなりません。 集めたデータと分析の関係は、食材と料理の関係に似ています。良い食材であっても料理人の腕に問題があると台無しになることがあります。不十分な食材でも調理しだいで美味し...
ちょっと理論面と言うかテクニカルと言うか、そんな話題になります。 機械学習で予測モデルなどを構築するとき、ちょいちょい顔をだすキーワードに、バイアス(Bias)とバリアンス(Variance)、そして正則化などがあります...
Excelなどでセルに入っている数字を元に、セルを色分けしたり、棒グラフをセルの中に描いたりすることがります。 そのようなことを、pandasのデータフレームを、Jupyter Notebook上に表示させるときできない...
データを上手く活用することで、収益や利益などの安定化を図ることが出来ます。 旧来から使われているワードで表現すると、平準化とレベルシフトです。 平準化とは、収益や利益などのばらつきを抑えること。統計学っぽく言うと、標準偏...
Caretは構築できる数理モデルが200種類を超え(2021年4月30日現在)、線形回帰モデルから、決定木系、ニューラルネット系と幅広いです。 前回は、Caretの概要とインストール、そして回帰問題を例に使い方を簡単に説...