機械学習の普及により、「予測」という視点の活用が拡大しています。 そのことで、ビジネスを構造的に理解し、近未来の手がかりを得ることができます。 従来の数理統計学的な手法にも、「予測」を可能とする手法は色々ありますが、機械...
ビジネスの世界で発生するデータの多くは、時間的概念の紐付いた時系列データです。 例えば、売上金額や受注件数、販売量、生産量、在庫量、PV(ページビュー)数、見込み顧客数、既存顧客数、離反顧客数、故障件数、広告宣伝費、人件...
時系列の深層学習(ディープラーニング)モデルの代表格がRNN(Recurrent Neural Network、リカレントニューラルネットワーク)です。RNNの構築方法と1期先予測(1-Step ahead predic...
時系列の深層学習(ディープラーニング)モデルの代表格がRNN(Recurrent Neural Network、リカレントニューラルネットワーク)です。 RNNの長期記憶が保持できないなどの問題点を改善する形で登場したL...
時系列の深層学習(ディープラーニング)モデルの代表格がRNN(Recurrent Neural Network、リカレントニューラルネットワーク)です。 他には、RNNの長期記憶を保存できないなどの問題点を改善する形で登...
キャンペーンや広告宣伝などのマーケティング活動を適切に評価するには、ベース販売高を見積もる必要があります。 ベース販売高とは、短期的なキャンペーンや広告宣伝などのマーケティング活動によらない販売高です。 短期的なキャンペ...
機械学習系のモデルを構築するときに外せない作業の1つが、特徴量エンジニアリング(Feature Engineering)です。 特徴量エンジニアリングの主な作業は、特徴量生成と特徴量選択(変数選択)です。 Feature...
売上増の方向性として2つあります。 すでに市場にいる既存顧客を競合から奪い取る 市場規模を拡大すべく市場外からの新規顧客を増やす どちらを選択すべきか、そしてどの程度達成したのかを判断するのが、次の2つの指標です。 市場...
時系列解析モデルと聞くと、AIRMAモデルや状態空間モデルなどの数理統計学系のモデルをイメージする人も多いことでしょう。そして難しく感じた人も多いことでしょう。 時系列モデルは難しそうなイメージがありますが、あまり数理的...
ngrok(エングロック)を使うことで、ローカル(localhost)で動いているアプリケーションを、インターネットからアクセスできるように外部公開することができます。 ローカル(localhost)で動いているアプリと...
手元のデータを、直感的にさくっと集計したり、グラフ化したりし、ちらっと確認したいことあると思います。 Pythonで、直感的にさくっと集計したり、グラフ化したりするには、壁あります。コーディングという壁があります。コーデ...
CLTV(顧客生涯価値)は、有料顧客であり続ける全期間において、どれだけの金額をビジネスにもたらすかを示す指標です。 どの顧客のCLTV(顧客生涯価値)が高く、どの顧客のCLTV(顧客生涯価値)が低いのかを見積もることは...
自社商品やサービスが、どの顧客セグメントに対し強いのか弱いのか、ポテンシャルが高いのか低いのかを示す指標が、構築指標です。 2種類あります。 カテゴリー構築指数 ブランド構築指数 計算式はどちらも簡単です。1顧客あたりの...
scikit-learnのモデルをOptunaでCV(クロスバリデーション)を実施する方法は2種類あります。 良し悪しを判断するメトリクスにscikit-learnのCVを指定する方法 OptunaのCV関数(Optun...
生存時間分析とは…… 生物の死 顧客の離反 機械システムの故障 ……など、あるイベント(例:死、離反、故障など)が発生するまでの時間(期間)を推測するための統計学的なデータサイエンス技術です。 ここでは、顧客の離反までの...
簡単に計算できそうでできない指標の1つに、市場シェアという指標があります。 市場をどのように定義するのかで値は変わってきますし、市場シェアの計算単位を金額で考えるのか数量で考えるのかでも値は変わってきます。 市場計算する...