mahal

基準標本に対するマハラノビス距離

ページ内をすべて折りたたむ

構文

d2 = mahal(Y,X)

説明

例

d2 = mahal(Y,X) は、X 内の基準標本に対する Y 内の各観測値のマハラノビス距離の二乗を返します。

例

すべて折りたたむ

マハラノビス距離と二乗ユークリッド距離の比較

ライブスクリプトを開く

相関二変量標本データセットを生成します。

rng('default') % For reproducibility
X = mvnrnd([0;0],[1 .9;.9 1],1000);

X の平均からユークリッド距離で等距離にある 4 つの観測値を指定します。

Y = [1 1;1 -1;-1 1;-1 -1];

X 内の基準標本に対する Y 内の各観測値のマハラノビス距離を計算します。

d2_mahal = mahal(Y,X)

d2_mahal = 4×1

    1.1095
   20.3632
   19.5939
    1.0137

X の平均に対する Y 内の各観測値の 2 乗ユークリッド距離を計算します。

d2_Euclidean = sum((Y-mean(X)).^2,2)

d2_Euclidean = 4×1

    2.0931
    2.0399
    1.9625
    1.9094

scatter を使用して、X と Y をプロットします。マーカーの色を使用して、X 内の基準標本に対する Y のマハラノビス距離を可視化します。

scatter(X(:,1),X(:,2),10,'.') % Scatter plot with points of size 10
hold on
scatter(Y(:,1),Y(:,2),100,d2_mahal,'o','filled')
hb = colorbar;
ylabel(hb,'Mahalanobis Distance')
legend('X','Y','Location','best')

Figure contains an axes object. The axes object contains 2 objects of type scatter. These objects represent X, Y.

Y 内のすべての観測値 ([1,1]、[-1,-1,]、[1,-1] および [-1,1]) は、X の平均からユークリッド距離で等距離にあります。しかし、マハラノビス距離では、[1,1] と [-1,-1] は [1,-1] と [-1,1] よりはるかに X に近くなります。データの共分散および異なる変数のスケールが考慮されるので、マハラノビス距離は外れ値の検出に役立ちます。

入力引数

すべて折りたたむ

`Y` — データ
n 行 m 列の数値行列

データ。n 行 m 列の数値行列を指定します。n は観測値の個数、m は各観測値の変数の個数です。

X と Y の列数は同じでなければなりませんが、行数を同じにする必要はありません。

データ型: single | double

`X` — 基準標本
p 行 m 列の数値行列

基準標本。p 行 m 列の数値行列を指定します。p は標本の個数、m は各標本の変数の個数です。

X と Y の列数は同じでなければなりませんが、行数を同じにする必要はありません。X の行数は列数より多くなければなりません。

データ型: single | double

出力引数

すべて折りたたむ

`d2` — マハラノビス平方距離
n 行 1 列の数値ベクトル

X 内の基準標本に対する Y 内の各観測値のマハラノビス距離の二乗。n 行 1 列の数値ベクトルとして返されます。n は X 内の観測値の個数です。

詳細

すべて折りたたむ

マハラノビス距離

マハラノビス距離は、標本点と分布の間の尺度です。

ベクトル y から平均 μ および共分散 Σ をもつ分布までのマハラノビス距離は次のようになります。

$d = \sqrt{(y - μ) \sum^{- 1} (y - μ)'} .$

この距離は、標準偏差単位で y が平均からどの程度離れているかを表します。

mahal は、Y 内の各観測値から X 内の基準標本までのマハラノビス平方距離 d² を返します。関数 mahal では、μ および Σ はそれぞれ基準標本の平均および共分散です。

バージョン履歴

R2006a より前に導入

参考

トピック

教師なし異常検出

mahal

構文

説明

例

マハラノビス距離と二乗ユークリッド距離の比較

入力引数

Y — データ n 行 m 列の数値行列

X — 基準標本 p 行 m 列の数値行列

出力引数

d2 — マハラノビス平方距離 n 行 1 列の数値ベクトル

詳細

マハラノビス距離

バージョン履歴

参考

トピック

`Y` — データ
n 行 m 列の数値行列

`X` — 基準標本
p 行 m 列の数値行列

`d2` — マハラノビス平方距離
n 行 1 列の数値ベクトル