データ分析や予測モデル構築などをやってみたいが……
- RやPythonだとの無料ツールはコーディングスキルがそれなりに必要になりハードルがある
- 有料ツールのSASやSPSSなどは使いやすそうだけど高額すぎる。
無料で使える使いやすさが有料級の分析ツールはないだろうか?
と言うことで、Radiantです。
Radiantは、ノーコードでビジネスデータ分析を可能にする無料で使える有料級Rパッケージです。
- その1:Radiantのインストール・起動・終了
- その2:Radiantのデータ読み込み
- その3:Radiantでデータ抽出(絞り込み)
- その4:RadiantでEDA(探索的データ分析)
- その4-1 グラフ作成
- その4-2 ピボット集計 ⇒ 今回
- その4-3 記述統計量
- その5:Radiantで予測モデル構築
前回は、その4-1の「グラフ作成」について簡単に説明しました。
ノーコードでビジネスデータ分析を可能にするRパッケージRadiantその4-1(RadiantでEDA – グラフ作成)
今回は、その4の「RadiantでEDA(探索的データ分析)」の「その4-2 ピボット集計」について簡単に説明します。
取り急ぎRadiantを起動
以下、コードです。
# 必要パッケージのロード library(radiant) # radiantの起動 radiant()
サンプルデータ
サンプルデータは、Radiantのサンプルデータである「diamonds」をそのまま使います。
- price: price in US dollars
- carat: weight of the diamond
- clarity: measurement of how clear the diamond
- cut: quality of the cut
- color: diamond color
- depth: total depth percentage
- table: width of top of diamond relative to widest point
- x: length in mm
- y: width in mm
- z: depth in mm
ピボット集計画面(Pivot)
データセットを読み込み、データ理解のために実施することと言えば……
- 読み込んだデータそのものを眺める
- データをグラフ化し視覚的に理解する
- データを色々な軸で集計し特徴を掴む
……などがあげられることでしょう。前回と前々回に、読み込んだデータそのものを眺めるお話しと、データのグラフ化のお話しをしました。今回は、集計です。
Radiantのメニューにある「Pivot」ボタンをクリックすると、集計用の画面が現れ、色々な軸でデータを集計することができます。
集計用の画面で設定する主な内容
集計用の画面で主に設定する内容です。
- Categorical variables:集計軸の設定(カテゴリカル変数)
- Numeric variable:集計対象の設定(数値変数)
- Apply function:集計方法の設定(カウント、平均、など)
- Normalize by:正規化の設定(ヨコ計で割る or タテ計で割る or 全体計で割る)
- Conditional formatting:集計結果のテーブルのセルの表現設定
- Show table:集計結果をテーブル表現する場合に✔を入れる
- Show plot:集計結果をグラフ表現する場合に✔を入れる
簡単なピボット集計例
以下、簡単なピボット集計例です。
- Categorical variables:clarity、cut
- Numeric variable:price
- Apply function:mean
- Normalize by:None
- Conditional formatting:Color bar
- Show table:✔
- Show plot:✔
次回
今回は、その4の「RadiantでEDA(探索的データ分析)」の「その4-2 ピボット集計」について簡単に説明しました。
- その1:Radiantのインストール・起動・終了
- その2:Radiantのデータ読み込み
- その3:Radiantでデータ抽出(絞り込み)
- その4:RadiantでEDA(探索的データ分析)
- その4-1 グラフ作成
- その4-2 ピボット集計
- その4-3 記述統計量 ⇒ 次回
- その5:Radiantで予測モデル構築
次回は、その4の「RadiantでEDA(探索的データ分析)」の「その4-3 記述統計量」について説明します。
ノンコードでビジネスデータ分析を可能にするRパッケージRadiantその4-3(RadiantでEDA – 記述統計量)