[For beginners] がんばれデータサイエンティスト!

Python の ハイパーパラメータ自動最適化ライブラリー Optuna その1<br> – Optuna のちょっとした使い方 –

Python の ハイパーパラメータ自動最適化ライブラリー Optuna その1
– Optuna のちょっとした使い方 –

機械学習などの数理モデルには、通常幾つかのハイパーパラメータがあり、そのハイパーパラメータの設定次第で大きく精度が変わります。 このハイパーパラメータを調整し最適な設定を探すタスクを、ハイパーパラメータチューニングと言い...
PythonのPandasを使った時系列データの3種類の特徴量(説明変数)の作り方

PythonのPandasを使った時系列データの3種類の特徴量(説明変数)の作り方

売上などのビジネス系のデータの多くは、時間概念が紐付いた時系列データです。 時間概念を取っ払ったテーブルデータと異なり、時系列データは、過去の値に大きく依存する、という特徴があります。そのため、一工夫必要になります。例え...
量質混在データ(数値変数とカテゴリカル変数が混在)に対する<br>Gower距離による階層型クラスタリング(Python)

量質混在データ(数値変数とカテゴリカル変数が混在)に対する
Gower距離による階層型クラスタリング(Python)

クラスター分析で利用されるメジャーなアルゴリズムは、非階層型クラスタリングのk-means法か、階層型のWard法がよく使われます。 問題は、量的データ(数値変数)のみを使うというところにあります。質的データ(カテゴリカ...
ノンコードで機械学習モデル構築 H2O Flow<br>その6(H2O Flow で実施する教師なし学習(次元削減・集約))

ノンコードで機械学習モデル構築 H2O Flow
その6(H2O Flow で実施する教師なし学習(次元削減・集約))

H2O(エイチツーオー)は、H2O.ai社によって開発された、インメモリ型の機械学習プラットフォームです。 教師あり学習や教師なし学習などの機械学習系の数理モデルを構築することができます。 嬉しいのが、ノンコードで機械学...
ノンコードで機械学習モデル構築 H2O Flow<br>その5(H2O Flow で実施する自動機械学習AutoML(分類問題))

ノンコードで機械学習モデル構築 H2O Flow
その5(H2O Flow で実施する自動機械学習AutoML(分類問題))

H2O(エイチツーオー)は、H2O.ai社によって開発された、インメモリ型の機械学習プラットフォームです。 教師あり学習や教師なし学習などの機械学習系の数理モデルを構築することができます。 嬉しいのが、ノンコードで機械学...