テーブルデータを生成するGANもあります。CTGAN(Conditional General Adversarial Networks)です。 あらかじめ準備されたデータをもとに、擬似的なテーブルデータを生成することがで...
テーブルデータを生成するGANもあります。CTGAN(Conditional General Adversarial Networks)です。 あらかじめ準備されたデータをもとに、擬似的なテーブルデータを生成することがで...
分析で利用するテーブルデータが少ないことがあります。 もう少し増やせないだろうか、と夢見ることも少なくないでしょう。 ここ最近、色々な生成AIが登場してきました。 そこで使われている技術の1つにGAN(敵対的生成ネットワ...
Jupyter AI は、JupyterLab の拡張機能で、色々なAI機能が提供されています。 その中で、データサイエンティストとして嬉しいのが、コード生成機能です。 会話しながら、Pythonコーディングを実施できま...
Jupyter AI は、JupyterLab の拡張機能で、色々なAI機能が提供されています。 その中で、データサイエンティストとして嬉しいのが、コード生成機能です。 会話しながら、Pythonコーディングを実施できま...
ChatGPT は優れたプログラマーでもあります。 そのため、Pythonのプログラミングするとき、ChatGPT に質問した体験をした方も多いことでしょう。 例えば、Jupyter Lab でプログラミングをしながら、...
機械学習のパイプラインとは、複数の処理を直列に連結したものです。 最小構成は、1つの変換器と1つの推定器(予測器)を連結したものです。 変換器:特徴量X(説明変数)などの欠測値処理や変数変換などの、特徴量変換(Trans...
分析で利用するテーブルデータが少ないことがあります。 もう少し増やせないだろうか、と夢見ることも少なくないでしょう。 ここ最近、色々な生成AIが登場してきました。 そこで使われている技術の1つにGAN(敵対的生成ネットワ...
データを入手したとき、最初に実施するタスクの1つが、探索的データ分析 (EDA) です。 探索的データ分析 (EDA) は、データをより深く理解するプロセスにおける重要なタスクです。 データの大まかな概要を把握するための...
機械学習のパイプラインとは、複数の処理を直列に連結したものです。 最小構成は、1つの変換器と1つの推定器(予測器)を連結したものです。 変換器:特徴量X(説明変数)などの欠測値処理や変数変換などの、特徴量変換(Trans...