Statistics Toolbox

探索的データ解析

Statistics Toolbox には、対話型グラフィックスによる統計プロッティング、クラスター解析のためのアルゴリズム、大規模なデータセットのための記述統計など、データ探索方法が数多く用意されています。

統計プロッティングと対話型グラフィックス

Statistics Toolbox には、データを視覚的に探索するためのグラフやチャートが用意されています。MATLAB® のプロット タイプに加え、確率プロット、ボックス プロット、ヒストグラム、散布ヒストグラム、3 次元ヒストグラム、制御チャート、分位数-分位数プロットなどが用意されています。また、樹形図、バイプロット、平行座標チャート、アンドリュース プロットなどの、多変量解析のための専用プロットも含まれています。

5 つの変数間の相互作用を示すグループ散布プロット行列。

5 つの変数間の相互作用を示すグループ散布プロット行列。

データセットの 5 つの数字による概要を提供する、ヒゲをもつコンパクトなボックス プロット。

データセットの 5 つの数字による概要を提供する、ヒゲをもつコンパクトなボックス プロット。

散布プロットとヒストグラムを組み合わせて変数間の関係を記述する散布ヒストグラム。

散布プロットとヒストグラムを組み合わせて変数間の関係を記述する散布ヒストグラム。

極値分布からのサンプルの経験的累積分布関数 (CDF) を、サンプリング分布の CDF のプロットと比較するプロット。

極値分布からのサンプルの経験的累積分布関数 (CDF) を、サンプリング分布の CDF のプロットと比較するプロット。

クラスター解析

Statistics Toolbox には、階層状クラスター化、k-means クラスター化、およびガウス混合を使用して、データを解析するためのアルゴリズムが豊富に用意されています。

2 成分ガウス混合モデルの、2 変量ガウス混合への近似

2 成分ガウス混合モデルの、2 変量ガウス混合への近似

クラスタリング アルゴリズムを同じ例に適用した場合の出力。

クラスタリング アルゴリズムを同じ例に適用した場合の出力。

4 つのクラスターをもつモデルを示す樹形図。

4 つのクラスターをもつモデルを示す樹形図。

例:クラスター解析

クラスター解析 (例)
k-means と階層状のクラスター化を使用して、データの自然なグループを発見します。

記述統計

記述統計によって、大規模のデータ セットでもすばやく理解して、記述することができます。Statistics Toolbox には、次の計算のための関数が用意されています。

  • 平均、中央値などさまざまな代表値
  • 範囲、分散、標準偏差、平均絶対偏差、中央絶対偏差などの分散度
  • 線形および順位 (偏) 相関係数
  • 欠損値を含むデータに基づく結果
  • 百分位数および四分位数推定値
  • カーネル平滑化関数を使用した密度の推定

上記の関数を使用して、高度に関連付けられた値でデータ サンプルの値を要約することができます。

場合によっては、パラメトリック手法を使用して要約統計量を推定できないことがあります。このような場合に備え、Statistics Toolbox には次のリサンプリング手法が用意されています。

  • リサンプリングを使用してサンプルの統計を推定するための、一般化されたブートストラップ関数
  • データのサブセットを使用してサンプルの統計を推定するための、ジャックナイフ関数
  • 信頼区間を推定するための関数 bootci
次のトピック: 線形、非線形モデリングおよび多変量統計

製品評価版の入手または製品の購入

評価版 Statistics Toolbox

評価版ソフトウェアを入手する

バイオメディカルシリーズ:MATLABによる、すぐできるデータ解析

Web セミナーを表示する