最近色々な自動機械学習 AutoML(Automated Machine Learning)が登場しています。 AutoML(自動機械学習)は、機械学習パイプライン(データセット→特徴量エンジニアリング→学習→評価など)...
クラスター分析で利用されるメジャーなアルゴリズムは、非階層型クラスタリングのk-means法か、階層型のWard法がよく使われます。 問題は、量的データ(数値変数)のみを使うというところにあります。質的データ(カテゴリカ...
顧客別CLTV(Individual CLTV)とは、顧客の金銭的価値のことで、将来行う取引に基づいて算出されます。 個々の顧客が将来どのくらいの利益を生み出すかがわかれば、価値の高い顧客に対し、マーケティング活動などを...
時系列モデルと言えば、ARIMAモデルです。最近では、FacebookのProphetモデルも人気です。 ThymeBoostは、時系列分解(トレンド成分・季節成分・など)と勾配ブースティング(XGBoostなど)を組み...
時系列解析系の数理モデルは色々ありますが、今も昔も時系列モデルと言えば、ARIMAモデル(SARIMAX含む)です。 ARIMAモデルの人気というか、実務的な活用は根強く、今も昔もメインで使われている気がしています。 要...
H2O(エイチツーオー)は、H2O.ai社によって開発された、インメモリ型の機械学習プラットフォームです。 教師あり学習や教師なし学習などの機械学習系の数理モデルを構築することができます。 嬉しいのが、ノンコードで機械学...
H2O(エイチツーオー)は、H2O.ai社によって開発された、インメモリ型の機械学習プラットフォームです。 教師あり学習や教師なし学習などの機械学習系の数理モデルを構築することができます。 嬉しいのが、ノンコードで機械学...
H2O(エイチツーオー)は、H2O.ai社によって開発された、インメモリ型の機械学習プラットフォームです。 教師あり学習や教師なし学習などの機械学習系の数理モデルを構築することができます。 嬉しいのが、ノンコードで機械学...
Pythonを使ってデータ分析やモデル構築などを行うとき、用途に応じて「仮想環境」 を作成し、必要に応じて切り替えて使用することがあります。 仮想環境を作ることで、例えばPC全体で使うPython環境に影響を与えずにライ...
PythonのピボットテーブルをExcelのように操作できないものだろうか、そう思った方も多いことでしょう。 そして、その操作結果をPythonコードで掃き出せないものだろうかと、そう思った方も多いことでしょう。 その2...