Pywedgeとは、Pythonの便利なライブラリーの1つです。主に以下のようなことができます。
- データビジュアライゼーション(データの可視化)
- データの前処理支援
- 機械学習のベースラインモデルの作成支援
ノンコードでGUIを使い plotly ベースのグラフなどを、さくっと作ることができます。
今回は、データビジュアライゼーション(データの可視化)について簡単に説明します。
Pywedge のインストール
Pywedgeは、コマンドプロンプトで以下のコマンドを実行しインストールします。
pip install pywedge
サンプルデータ
サンプルデータは、みんな大好きアヤメ(iris)のデータセットになります。
今回は、seabornのアヤメ(iris)データセットを使います。
アヤメ(iris)のデータセットの概要については、以下を参照ください。どういったデータセットなのかを、ちょっとだけ説明しています。
■データセットの概要説明
「予測モデルは機械学習パイプライン化しよう(Python)
https://www.salesanalytics.co.jp/datascience/datascience007/
必要なライブラリーの読み込み
以下、コードです。
# ライブラリーの読み込み import pandas as pd import pywedge as pw import seaborn as sns
データセットの読み込み
以下、コードです。
# データセットの読み込み df = sns.load_dataset("iris") df #確認用
以下、実行結果です。
Pywedgeを使ったデータの可視化
(データビジュアライゼーション)
Pywedge_Chartsで可視化します。
Pywedge_Chartsでは、次の3つの設定をする必要があります。
- 対象のデータセット(dataframe)
- 可視化しない列(c)
- 目的変数(y)
以下、コードです。
# Pywedgeでデータの可視化 mc = pw.Pywedge_Charts(df, c=None, y="species" ) chart = mc.make_charts()
以下、実行結果です。
タブでビジュアライゼーションのタイプを選び、その後に変数や色などを選択します。
今(2021年7月29日現在)は、ビジュアライゼーションのタイプは以下の8つです。
- Scatter Plot(散布図)
- Pie Chart(円グラフ)
- Bar Plot(棒グラフ)
- Violin Plot(バイオリンプロット)
- Box Plot(箱ひげ図)
- Distribution Plot(分布プロット)
- Histgram(ヒストグラム)
- Correlation plot(相関行列ヒートマップ)
興味のある方は、実際に手を動かして、どのような感じになるのか確かめてみたください。
まとめ
今回は、Pywedge を使ったお手軽データビジュアライゼーション(データの可視化)について簡単に説明しました。
Pywedgeは、主に以下のようなことができます。
- データビジュアライゼーション(データの可視化)
- データの前処理支援
- 機械学習のベースラインモデルの作成支援
Pywedgeはどちらかと言うと、データビジュアライゼーションのツールとして使った方がいいでしょう。興味のある方はデータビジュアライゼーションのついでに、以下の記事を参考にモデル構築にチャレンジしてみてください。非常に簡単です。