前回まででH2Oを使う準備が整いました。
いよいよH2OのAutoMLを使ってみましょう。
今回は、「H2OのAutoMLでできること」についてお話しをします。
H2OのAutoMLでできるビジネス範囲
機械学習は、ビジネス課題の特定からシステムの運用までのタスクで成り立ちます。
このうち、H2OのAutoMLは機械学習モデルの作成のうち、データの特徴量設計から学習までを自動化します。
これにより、データサイエンティストはビジネス課題の特定や機械学習モデルシステムの構築、運用に集中することができます。
H2OのAutoMLで解ける問題
機械学習で解ける問題には回帰問題と分類問題(二値・多値)、クラスタリング、異常検知などがあります。
このうちH2OのAutoMLで解けるのは回帰問題と分類問題です。分類問題は二値分類と多値分類に対応しています。
- 回帰問題 … 予測したい値が連続値を取る問題です。予測値も連続になります。例えば売上予測、客数予測などです。
- 二値分類問題 … 予測したい値が0か1かの2値を取る問題です。あるカテゴリに属するかしないかを予測することが多いです。例えばゲームの勝敗、メールのスパム判定などです。
- 多値分類問題 … 3つ以上のカテゴリを予測したい場合の問題です。例えば文書のカテゴリ分類、花の種類分類などがあります。
H2OのAutoMLの機能
H2OのAutoMLでできる主な機能は次の通りです。
概要 | 内容 | 関数・変数名 (R) |
関数・変数名 (Python) |
モデルの学習 | 学習用データセットを使って学習します | h2o.automl() | H2OAutoML() |
学習済モデルを使った予測 | 学習済モデルに予測用データセットを入力して予測します | h2o.predict() | aml.predict() |
リーダーボードの出力 | 学習した複数のモデルの成績表を出力します。 | aml@leaderboard | aml.leaderboard |
学習済モデルの保存 | 学習済モデルをあとで取り出せるようにMOJOという形式で保存できます。 | h2o.saveModel() | h2o.save_model() |
学習済モデルの詳細の表示 | 学習済モデルがどのような予測器から生成されているか表示します。 | aml@leader | aml.leader |
学習済モデルの解析 | 学習済みモデルの残差等をテストデータを使って解析します。 | h2o.explain() | aml.explain() |
※amlは学習済モデルが保存されている変数
H2Oそのものは機械学習のプラットフォームなので他にもできることがありますが、本講座ではAutoMLに絞って紹介したいと思います。
次回
次回からいよいよH2OのAutoMLを使ってみることにします。まずは回帰問題からです。