数理モデルを作る上で特徴量エンジニアリング(Feature Engineering)は地味に重要です。 例えば、より精度の高い予測モデルを構築したいのであれば、アルゴリズムのパラメータチューニングとともに特徴量エンジニア...
Excelのワークシートで、データセットを眺めたりインタラクティブに編集することに慣れている人は多いです。 そういう方にとって、RやPythonなどの無味乾燥なGUIに物足りなさというか、壁を感じる方もいるかもしれません...
Rにはディープラーニング関連のパッケージは色々あります。R独自のものから、そうでないものもあります。 ディープライニングで有名なKeras(TensorFlow)はRStudio(R)上で使うことができます。 前回は分類...
Rにはディープラーニング関連のパッケージが色々あります。 例えば…… neuralnet nnet RSNNS deepnet darch rnn FCNN4R rcppDL deepr MXNetR h2o tenso...
PythonでEDA(探索的データ分析)を実施するとき、PandasのQuery(クエリ―)を使う方も多いことでしょう。 ここで紹介するQuery(クエリ―)は、Pandasの関数の1つで、データフレームに対し条件抽出す...
データセットを手にしたら、最初に実施するのがEDA(探索的データ分析)です。 端的に言うと、データと仲良くなるための会話です。 EDA(探索的データ分析)はほぼ半分は似たような分析を実施します。EDA(探索的データ分析)...
RだろうがPythonだろうが、データフレームを再構築することは少なくないでしょう。 例えば…… 縦持ち(Long)のデータフレームを、横持ち(Wide)のデータフレームに再構築 横持ち(Wide)のデータフレームを、縦...
Pythonでデータ分析をするとき、Pandasを使わない人はいないぐらいです。 Pandasの幾つかの機能を高速化するライブラリーがあります。 計算処理を並列化するPandaralellです。 ただ、すべての処理が高速...
データ分析を実施するとき、必ずと言っていいほど実施するのが、EDA(探索的データ分析)です。 Pythonだと、Pandasを使いEDAを実施する人も、多いのではないでしょうか。しかし、PythonでEDAを実施する場合...
ビジネス系のデータ分析には、時間という概念が付いて回ることが多いです。 必ずというわけではありませんが、場合によっては「時間」に関する情報を使用することもあるでしょう。 Pythonですと、datetimeモジュールを利...