H2OのAutoMLでできること

H2OのAutoMLでできること

前回まででH2Oを使う準備が整いました。

H2Oをインストールする(Python編)

H2Oをインストールする(R編)

いよいよH2OAutoMLを使ってみましょう。

今回は、「H2OのAutoMLでできること」についてお話しをします。

H2OAutoMLでできるビジネス範囲

機械学習は、ビジネス課題の特定からシステムの運用までのタスクで成り立ちます。

このうち、H2OAutoML機械学習モデルの作成のうち、データの特徴量設計から学習までを自動化します。

これにより、データサイエンティストはビジネス課題の特定機械学習モデルシステムの構築、運用に集中することができます。

 

H2OAutoMLで解ける問題

 機械学習で解ける問題には回帰問題分類問題(二値・多値)クラスタリング異常検知などがあります。

このうちH2OAutoMLで解けるのは回帰問題分類問題です。分類問題二値分類多値分類に対応しています。

  • 回帰問題 … 予測したい値が連続値を取る問題です。予測値も連続になります。例えば売上予測、客数予測などです。
  • 二値分類問題 … 予測したい値が01かの2値を取る問題です。あるカテゴリに属するかしないかを予測することが多いです。例えばゲームの勝敗、メールのスパム判定などです。
  • 多値分類問題 … 3つ以上のカテゴリを予測したい場合の問題です。例えば文書のカテゴリ分類、花の種類分類などがあります。

 

H2OAutoMLの機能

H2OAutoMLでできる主な機能は次の通りです。

概要 内容 関数・変数名
R
関数・変数名
Python
モデルの学習 学習用データセットを使って学習します h2o.automl() H2OAutoML()
学習済モデルを使った予測 学習済モデルに予測用データセットを入力して予測します h2o.predict() aml.predict()
リーダーボードの出力 学習した複数のモデルの成績表を出力します。 aml@leaderboard aml.leaderboard
学習済モデルの保存 学習済モデルをあとで取り出せるようにMOJOという形式で保存できます。 h2o.saveModel() h2o.save_model()
学習済モデルの詳細の表示 学習済モデルがどのような予測器から生成されているか表示します。 aml@leader aml.leader
学習済モデルの解析 学習済みモデルの残差等をテストデータを使って解析します。 h2o.explain() aml.explain()

amlは学習済モデルが保存されている変数

H2Oそのものは機械学習のプラットフォームなので他にもできることがありますが、本講座ではAutoMLに絞って紹介したいと思います。

 

次回

次回からいよいよH2OAutoMLを使ってみることにします。まずは回帰問題からです。