以下を見て、どのような印象を持つでしょうか? 90%の有効性のある新型コロナワクチンが登場しました! 日本の離婚率35%だから、今や3組に1組が離婚する時代だ! この「有効性」は「ワクチン有効率」という指標を指しています...
発展途上ではありますが、個人的に注目している時系列解析のライブラリーがあります。Sktimeというライブラリーです。 名前から想像できる通り、Pythonの有名な機械学習ライブラリーScikit-learn(sklear...
前回、パイプラインの評価指標を一覧にしました。 実際にTPOTを使うときに、使いたい評価指標が実装されていないこともあると思います。 例えば回帰問題でよく使われるRMSE(Root Mean Squared Error、...
日時: 2021年3月9日(火)10:00~18:00 受講料: お1人様 50,000円(税抜) 会場: オンライン開催(PCとインターネット接続環境があればどこからでも参加頂けます) 主催: ソフトブレーン・サービス...
効果検証をする方法は色々あります。 前回(第219話|データによる効果検証とネクストアクション)で上げたのが以下の3つです。 AB比較分析 Before&After分析 差分の差分析 Before&Aft...
Jupyter Notebook(IPython notebook)でライブラリー「matplotlib」を使いグラフ表示する人は多いと思います。 matplotlibを使いグラフ表示と言っても、幾つかのやり方があります...
データ分析前の準備は非常に重要です。 どのような準備をするのかが、あなたの望んだ成果(成功)に大きく影響します。その肝になるのがメッセージの品質です。つまり、データ分析前の準備とはメッセージ品質を高める準備をするのです。...
これまでの例では…… 分類問題:F値(f1) 回帰問題:決定係数(r2) ……でパイプラインを評価してきました。 今回は他にどのような評価指標があるか説明します。 なお、評価指標はTPOTClassifierとTPOTR...
プロモーションを実施したとき、その効果を知りたくなるものです。 例えば、A群とB群に分け、A群には従来のプロモーションを実施し、B群には新しいプロモーションを試したとき、売上などがどう異なるのかを検証するといったものです...
開催概要 日時: 2021年2月25日(木)10:30~11:30 受講料: 無料 会場: オンライン(PCとインターネット接続環境があればどこからでも参加頂けます) 主催: 株式会社パワー・インタラクティブ アジェンダ...
PythonのNumPyやPandas、Scikit-Learn(sklearn)で扱えないぐらいビッグなデータならDaskです。 Pythonでデータ分析をするとき、NumPyやPandas、Scikit-Learn(...
データ分析前の準備は非常に重要です。 どのような準備をするのかが、あなたの望んだ成果(成功)に大きく影響します。その肝になるのがメッセージの品質です。つまり、データ分析前の準備とはメッセージ品質を高める準備をするのです。...
TPOTは複数のパイプラインを構成し、評価します。 そのうち最も良いものを最適なパイプラインとして出力します。 人によっては、途中でどのようなパイプラインを構成し評価したのか、気になる方もいることでしょう。 実務的には、...
ここ数年、「攻めのIT」ということが盛んに言われています。 そこに2004年にスウェーデンのウメオ大学のエリック・ストルターマン(Erik Stolterman)が提唱したDX(デジタルトランスフォーメーション)が紐づい...
予測モデルなどを構築するとき、パイプライン化することがあります。 もちろん、探索的なデータ分析でも、パイプラインを使いながら実施することもあります。 例えば、Rなどでは伝統的に、パイプラインを使いながら探索データ分析をし...
データ分析前の準備は非常に重要です。 どのような準備をするのかが、あなたの望んだ成果(成功)に大きく影響します。その肝になるのがメッセージの品質です。つまり、データ分析前の準備とはメッセージ品質を高める準備をするのです。...