時系列の深層学習(ディープラーニング)モデルの代表格がRNN(Recurrent Neural Network、リカレントニューラルネットワーク)です。 他には、RNNの長期記憶を保存できないなどの問題点を改善する形で登...
機械学習系のモデルを構築するときに外せない作業の1つが、特徴量エンジニアリング(Feature Engineering)です。 特徴量エンジニアリングの主な作業は、特徴量生成と特徴量選択(変数選択)です。 Feature...
時系列解析モデルと聞くと、AIRMAモデルや状態空間モデルなどの数理統計学系のモデルをイメージする人も多いことでしょう。そして難しく感じた人も多いことでしょう。 時系列モデルは難しそうなイメージがありますが、あまり数理的...
ngrok(エングロック)を使うことで、ローカル(localhost)で動いているアプリケーションを、インターネットからアクセスできるように外部公開することができます。 ローカル(localhost)で動いているアプリと...
手元のデータを、直感的にさくっと集計したり、グラフ化したりし、ちらっと確認したいことあると思います。 Pythonで、直感的にさくっと集計したり、グラフ化したりするには、壁あります。コーディングという壁があります。コーデ...
scikit-learnのモデルをOptunaでCV(クロスバリデーション)を実施する方法は2種類あります。 良し悪しを判断するメトリクスにscikit-learnのCVを指定する方法 OptunaのCV関数(Optun...
生存時間分析とは…… 生物の死 顧客の離反 機械システムの故障 ……など、あるイベント(例:死、離反、故障など)が発生するまでの時間(期間)を推測するための統計学的なデータサイエンス技術です。 ここでは、顧客の離反までの...
離反時期や故障時期などを分析する生存時間分析を実施する手段は色々ありますが、生存時間用のライブラリーを活用するのがいいでしょう。 今回利用するのは、LifelinesというPythonのライブラリーです。 生存時間分析ラ...
生存時間分析とは…… 生物の死 顧客の離反 機械システムの故障 ……など、あるイベント(例:死、離反、故障など)が発生するまでの時間(期間)を推測するための統計学的なデータサイエンス技術です。 詳細というか概要を以下の記...
機械学習などの数理モデルには、通常幾つかのハイパーパラメータがあり、そのハイパーパラメータの設定次第で大きく精度が変わります。 このハイパーパラメータを調整し最適な設定を探すタスクを、ハイパーパラメータチューニングと言い...