ドキュメンテーション センター

  • 評価版
  • 製品アップデート

最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。

一般化パレート分布

定義

形状パラメーター k ≠ 0、スケール パラメーター σ、限界値パラメーター θ をもつ一般化パレート分布の確率密度関数は、次の式で表されます。

k > 0 の場合、θ < x です。または k < 0 の場合、θ < x < θ – σ/k です。

k = 0 の場合、密度は

です。ここで θ < x です。

k = 0 かつ θ = 0 の場合、作成されたパレート分布は指数分布になります。k > 0 かつ θ = σ/k の場合、作成されたパレート分布は指数分布になります。

背景

指数分布のように、一般化パレート分布は、他の分布の裾をモデル化するのに使用される場合がしばしばあります。たとえば、製造工程からのワッシャーがあるとします。工程のランダムな影響によって、ワッシャーのサイズに違いが生じる場合は、これらのサイズのモデル化に正規分布のような標準の確率分布を使用できます。ただし、正規分布は、最頻値の近くでは良いモデルであっても、裾では実際のデータに対する良い近似でないこともあり、すべての範囲のデータを記述するには、より複雑なモデルが必要になることがあります。一方、あるしきい値よりもワッシャーのサイズを大きい (または小さい) とだけ記録することは、しきい値を超えると考えられる、これらの裾のデータを別々のモデルで近似できることを意味します。このように、一般化パレート分布は、複雑なデータの極端なものに対して良い近似を与えるために使用できます。

一般化パレート分布によって、特別な場合として指数分布とパレート分布の両方を含む、可能な形状の連続する範囲が実現します。これらの分布のいずれかを使用して、しきい値を超える特定のデータセットをモデル化できます。一般化パレート分布により、どの分布が適切であるかを「データに決めさせる」ことができます。

一般化パレート分布には 3 つの基本的な形式があり、それぞれが、基準となる分布の別のクラスから派生した超過データの極限分布に該当します。

  • 正規分布のように、指数減衰する裾をもつ分布は、形状パラメーターがゼロの一般化パレート分布になります。

  • スチューデントの t 分布のように、多項式減衰する裾をもつ分布は、正の形状パラメーターをもちます。

  • ベータ分布のように、分布の裾が有限の場合は、負の形状パラメーターをもちます。

一般化パレート分布は paretotails クラスの分布 Fit オブジェクトの裾で使用されます。

パラメーター

自由度 5 のスチューデント t 分布から取り出された多数の乱数値を生成し、2 より小さい値を破棄する場合、これらのしきい値を超過する値は一般化パレート分布で近似できます。

t = trnd(5,5000,1);
y = t(t > 2) - 2;
paramEsts = gpfit(y)
paramEsts =
    0.1267    0.8134

スチューデントの t 分布を超過するデータに基づき推測する、形状パラメーターの推定 (最初の要素) は正であることに注意してください。

hist(y+2,2.25:.5:11.75);
set(get(gca,'child'),'FaceColor',[.8 .8 1])
xgrid = linspace(2,12,1000);
line(xgrid,.5*length(y)*...
     gppdf(xgrid,paramEsts(1),paramEsts(2),2));

次のコードは、一般化パレート分布の基本的な 3 つの形式に対する確率密度関数の例を作成します。

x = linspace(0,10,1000);
y1 = gppdf(x,-.25,1,0); 
y2 = gppdf(x,0,1,0); 
y3 = gppdf(x,1,1,0)
plot(x,y1,'-', x,y2,'-', x,y3,'-')
legend({'K<0' 'K=0' 'K>0'});

k < 0 の場合、分布は、 に対して確率密度が 0 になることに注意してください。k0 の場合は、上限はありません。

この情報は役に立ちましたか?