Main Content

summary

(非推奨) データセット配列のまとめの表示

dataset データ型は推奨されません。異種混合データを処理するには、代わりに MATLAB® table データ型を使用します。詳細は、MATLAB table ドキュメンテーションを参照してください。

構文

summary(A)
s = summary(A)

説明

summary(A) は、データセット配列とそこに含まれる変数のまとめを表示します。

s = summary(A) は、データセット A のまとめと A が含む変数を含む、スカラー構造体 s を返します。s のフィールドの詳細は、「出力」を参照してください。

まとめの情報はデータ セットの変数のタイプにより変わります。

  • 数値変数の場合、summary はデータのまとめの 5 つの数字、最小値、1 番目の四分位、中央値、3 番目の四分位、最大値を計算します。

  • 論理変数の場合、summary はデータ内の true の数と false の数をカウントします。

  • カテゴリカル変数の場合、summary は各水準におけるデータ数をカウントします。

出力引数

次のリストは構造体 s のフィールドを示しています。

  • Description — データセットの説明を含む文字配列。

  • Variables — A 内の各データセット変数に対して 1 つずつ要素がある構造体配列。各要素には次のフィールドがあります。

    • Name — 変数名が含まれている文字ベクトル。

    • Description — 変数の説明が含まれている文字ベクトル。

    • Units — 変数の単位が含まれている文字ベクトル。

    • Size — 変数のサイズを含む数値ベクトル

    • Class — 変数のクラスが含まれている文字ベクトル。

    • Data — 以下のフィールドをもつスカラー構造体

      数値変数の場合:

      • Probabilities — 確率 [0.0 .25 .50 .75 1.0] と NaN (対応するデータセット変数にあれば) を含む数値ベクトル。

      • Quantiles — データセット変数に対応する"確率"に対する値と NaN のカウント数 (ある場合) を含む数値ベクトル。

      論理変数の場合:

      • Values — logical ベクトル [true false]。

      • Counts — 各論理値のカウント数の数値ベクトル。

      カテゴリカル変数の場合:

      • Levels — 対応するデータセット変数の各水準のラベルを含む cell 配列。

      • Counts — 各水準のカウント数の数値ベクトル。

      数値変数、カテゴリカル変数、論理変数のいずれでもない場合、'Data' は空になります。データセット変数が 2 列以上の場合、対応する 'Quantiles' フィールドまたは 'Counts' フィールドは行列または配列になります。

フィッシャーのアヤメのデータのまとめを表示します。

load fisheriris
species = nominal(species);
data = dataset(species,meas);
summary(data)
species: [150x1 nominal]
  setosa   versicolor   virginica
      50           50          50
meas: [150x4 double]
  min       4.3000         2         1    0.1000 
  1st Q     5.1000    2.8000    1.6000    0.3000 
  median    5.8000         3    4.3500    1.3000 
  3rd Q     6.4000    3.3000    5.1000    1.8000 
  max       7.9000    4.4000    6.9000    2.5000

hospital.mat のデータのまとめを表示します。

load hospital
summary(hospital)

Dataset array created from the data file hospital.dat.

The first column of the file ("id") is used for observation
names.  Other columns ("sex" and "smoke") have been 
converted from their original coded values into categorical
and logical variables.  Two sets of columns ("sys" and 
"dia", "trial1" through "trial4") have been combined into 
single variables with multivariate observations.  Column 
headers have been replaced with more descriptive variable 
names.  Units have been added where appropriate.


LastName: [100x1 cell array of character vectors]
Sex: [100x1 nominal]
     Female      Male 
         53        47 

Age: [100x1 double, Units = Yrs]
     min      1st Q      median      3rd Q      max
      25         32          39         44       50

Weight: [100x1 double, Units = Lbs]
     min      1st Q         median        3rd Q        max
     111      130.5000      142.5000      180.5000     202

Smoker: [100x1 logical]
     true      false 
       34         66 

BloodPressure: [100x2 double, Units = mm Hg]
Systolic/Diastolic
     min              109           68 
     1st Q       117.5000      77.5000 
     median           122      81.5000 
     3rd Q       127.5000           89 
     max              138           99 

Trials: [100x1 cell, Units = Counts]
From zero to four measurement trials performed

参考

| |