基本統計量

Statistics タブでは、選択した列の統計情報を確認できます。

基本的な使い方の「基本統計量を見る」セクションもご覧ください。

測定尺度と統計量

MIDASでは、列の測定尺度（Nominal、Ordinal、Interval、Ratio）に応じて、統計的に意味のある項目のみを表示します。

統計量	Nominal	Ordinal	Interval	Ratio
Valid values	o	o	o	o
Missing values	o	o	o	o
Mode	o	o	o	o
Min / Max		o	o	o
Median		o	o	o
Mean			o	o
Std Dev			o	o
Coef. of Variation				o
Geometric Mean				o

たとえば、郵便番号は Nominal（名義尺度）として扱うのが適切です。名義尺度として扱うと、平均や標準偏差は表示されません。これは、名義尺度では数値の大小関係に意味がないためです（郵便番号 100-0001 が 150-0001 より「小さい」ことに意味はありません）。

一方、気温のデータは Interval（間隔尺度）として扱うのが適切です。間隔尺度として扱うと、平均や標準偏差が計算されます。

測定尺度の変更方法についてはデータの準備と読み込みをご覧ください。

Show stats by オプションを使うと、カテゴリ列でデータをグループ化し、グループごとの統計量を確認できます。

Iris データセットで sepal_length 列を選択し、species でグループ化すると：

がそれぞれ表示され、品種間の比較ができます。

文字列の列を選択すると、以下が表示されます：

True/False の列を選択すると、以下が表示されます：

日時の列を選択すると、以下が表示されます：

Statistics タブのヒストグラムや散布図から、データの行を選択できます。

追加選択: Ctrl（Mac: Cmd）キーを押しながらクリックすると、既存の選択に追加できます。

複数の数値列を選択すると表示される相関散布図でも、同様に行を選択できます：