Main Content

線形混合効果モデル

線形混合効果モデルは、グループ別に収集および集計されたデータに関する線形回帰モデルの拡張です。これらのモデルは、1 つ以上のグループ化変数によって変化する可能性のある係数を使用して、応答変数と独立変数の関係を説明します。混合効果モデルは固定効果と変量効果の 2 つの部分から構成されます。固定効果の項は通常、従来の線形回帰部分であり、変量効果は母集団から無作為に選ばれる個々の実験単位に関連付けられます。変量効果には事前分布がある一方、固定効果にはありません。混合効果モデルは、同じレベルのグループ化変数を含む観測値に共通の変量効果を関連付けることで、データのグループ化に関する共分散構造を表現できます。線形混合効果モデルの標準形式は次のとおりです。

y=Xβfixed+Zbrandom+εerror,

ここで

  • y は n 行 1 列の応答ベクトル、n は観測数です。

  • X は n 行 p 列の固定効果計画行列です。

  • β は p 行 1 列の固定効果ベクトルです。

  • Z は n 行 q 列の変量効果計画行列です。

  • b は q 行 1 列の変量効果ベクトルです。

  • ε は n 行 1 列の観測誤差ベクトルです。

線形混合効果モデルの仮定は以下のとおりです。

  • 変量効果ベクトル b と誤差ベクトル ε には次のような事前分布があります。

    b~N(0,σ2D(θ)),ε~N(0,σI2),

    ここで、D は分散成分ベクトル θ によってパラメーター表現されている対称な半正定値行列、I は n 行 n 列の単位行列、σ2 は誤差分散です。

  • 変量効果ベクトル b と誤差ベクトル ε は相互に独立しています。

混合効果モデルは、コンテキストに応じて "多層モデル" や "階層モデル" とも呼ばれます。この 2 つよりも混合効果モデルの方が一般的な用語です。混合効果モデルには、交差した要素のように、必ずしもマルチレベルや階層的ではない要素が含まれる場合もあります。このため、ここでは混合効果が推奨される用語です。混合効果モデルは、同時に近似される複数レベル回帰モデル (最初のレベルおよびグループ レベル モデル) と表現されることもあります。たとえば、1 つの連続予測子変数 x と M レベルの 1 つのグループ化変数がある、切片が可変またはランダムなモデルは、次のように表すことができます。

yim=β0m+β1xim+εim,i=1,2,..,n,m=1,2,...,M,εim~N(0,σ2),β0m=β00+b0m,b0m~N(0,σ02),

ここで、yim は観測値 i とグループ m のデータに対応しており、n は観測値の総数です。b0m と εim は互いに独立しています。グループレベルのパラメーターを第 1 レベルのモデルに代入すると、応答ベクトルのモデルは次のようになります。

yim=β00+β1ximfixedeffects+b0mrandomeffects+εim.

1 つの連続予測子変数 x があり、切片と勾配がランダムなモデルは、切片と勾配の両方が M レベルのグループ化変数によって独立して変化する場合、次のようになります。

yim=β0m+β1mxim+εim,i=1,2,...,n,m=1,2,...,M,εim~N(0,σ2),β0m=β00+b0m,b0m~N(0,σ02),β1m=β10+b1m,b1m~N(0,σ12),

または

bm=(b0mb1m)~N(0,(σ0200σ12)).

変量効果が相関している場合もあります。一般に、切片と勾配がランダムなモデルの場合、変量効果の分布は次のようになります。

bm=(b0mb1m)~N(0,σD2(θ)),

ここで、D は分散成分ベクトル θ によってパラメーター表現されている 2 行 2 列の対称な半正定値行列です。

グループレベルのパラメーターを第 1 レベルのモデルに代入すると、応答ベクトルのモデルは次のようになります。

yim=β00+β10ximfixedeffects+b0m+b1mximrandomeffects+εim,i=1,2,...,n,m=1,2,...,M.

変量効果の項のグループレベル変数 xim を zim で表すと、このモデルは次のようになります。

yim=β00+β10ximfixedeffects+b0m+b1mzimrandomeffects+εim,i=1,2,...,n,m=1,2,...,M.

この場合、固定効果計画行列と変量効果計画行列の両方で同じ項が現れます。それぞれの zim と xim はグループ化変数のレベル m に対応します。

グループレベルの予測子変数をさらに追加すると、より多くのグループレベルの変数を説明することもできます。1 つの連続予測子変数 x をもつ、切片がランダムなモデルおよび勾配がランダムなモデルは、切片と勾配の両方が M レベルのグループ化変数と 1 つのグループレベルの予測子変数 vm によって独立して変化する場合、次のようになります。

yim=β0im+β1imxim+εim,i=1,2,...,n,m=1,2,...,M,εim~N(0,σ2),β0im=β00+β01vim+b0m,b0m~N(0,σ02),β1im=β10+β11vim+b1m,b1m~N(0,σ12).

結果的にモデルは、次のように、グループレベル予測子の主効果と、応答変数のモデルの第 1 レベルとグループレベルの予測子変数間における交互作用項となります。

yim=β00+β01vim+b0m+(β10+β11vim+b1m)xim+εim,i=1,2,...,n,m=1,2,...,M,=β00+β10xim+β01vim+β11vimximfixedeffects+b0m+b1mximrandomeffects+εim.

項 β11vmxim は、多層モデルに関する多くの教本において交差レベル交互作用と呼ばれることもあります。応答変数 y のモデルは次のように表現できます。

yim=[1x1imvimvimx1im][β00β10β01β11]+[1x1im][b0mb1m]+εim,i=1,2,...,n,m=1,2,...,M,

これは、前述した次の標準形式に対応します。

y=Xβ+Zb+ε.

一般に、グループ化変数が R 個あり、m(r,i) が観測値 i についてグループ化変数 r のレベルを表す場合、観測値 i の応答変数のモデルは次のようになります。

yi=xiTβ+r=1Rzirbm(r,i)(r)+εi,i=1,2,...,n,

ここで、β は p 行 1 列の固定効果ベクトル、b(r)m(r,i) は r 番目のグループ化変数とレベル m(r,i) についての q(r) 行 1 列の変量効果ベクトル、εi は観測値 i についての 1 行 1 列の誤差項です。

参照

[1] Pinherio, J. C., and D. M. Bates. Mixed-Effects Models in S and S-PLUS. Statistics and Computing Series, Springer, 2004.

[2] Hariharan, S. and J. H. Rogers. “Estimation Procedures for Hierarchical Linear Models.” Multilevel Modeling of Educational Data (A. A. Connell and D. B. McCoach, eds.). Charlotte, NC: Information Age Publishing, Inc., 2008.

[3] Hox, J. Multilevel Analysis, Techniques and Applications. Lawrence Erlbaum Associates, Inc., 2002

[4] Snidjers, T. and R. Bosker. Multilevel Analysis. Thousand Oaks, CA: Sage Publications, 1999.

[5] Gelman, A. and J. Hill. Data Analysis Using Regression and Multilevel/Hierarchical Models. New York, NY: Cambridge University Press, 2007.

参考

| |

関連するトピック