Main Content

多次元尺度構成法

データの可視化において最も重要な目標の 1 つは、点が互いにどれだけ近くにあるか、あるいは、遠くにあるかという感覚を得ることです。時には、散布図によりこれを行うことができます。しかし、解析によっては、ユーザーがもつデータは、点の形にはなっておらず、事例、観測、問題間の類似度や非類似度のペアの形になっていることもあります。プロットする点がありません。

データがペア間の距離ではなく、点の形をしていても、これらのデータの散布図は有効ではないでしょう。データの種類によっては、2 点がどれだけ "近い" かを測る適切な方法は、そのユークリッド距離ではないでしょう。生のデータの散布図がユークリッド距離の比較を容易にする一方、それらは、たとえば、市街地距離、あるいは、より一般的な非類似度など、点間の他の種類の距離を比較する場合、必ずしも有効ではありません。また、変数が多い場合、データが小さい数の次元数で表されていないと、距離を可視化することが非常に難しくなります。通常、次元削減のための何らかの並べ替えが必要です。

多次元尺度構成法 (MDS) はこれらの問題すべてに取り組む 1 組の方法です。MDS は、多くの種類の距離または非類似度の尺度について互いにどれほど近い点であるかを可視化し、データを低次元で表現することができます。MDS は、生データを必要としませんが、ペア間の距離または非類似度行列のみを必要とします。

参考

|

関連するトピック