عامل تورم واریانس در مدل های رگرسیون خطی یکی از روش های تخمین پارامترهای مدل، روش حداقل مربعات می باشد. یکی از مسائل و مشکلاتی که می تواند این روش را به چالش بکشد، وجود پدیده ای به نام هم خطی (multicolinearity) می باشد. یکی از شیوه های تشخیص وجود هم خطی که کاربرد زیادی دارد، استفاده از عامل تورم واریانس (Variance Inflation Factor) می باشد. این عامل نشان می دهد که واریانس ضرایب تخمینی تا چه حد نسبت به حالتی که متغیرهای تخمینی، هم بستگی خطی ندارند، متورم شده است.برای درک اهمیت عامل تورم واریانس از دقت ضرایب تخمین زده شدهٔ رگرسیون با روش حداقل مربعات که توسط واریانس آن ها اندازه گیری می شود، شروع می کنیم. مدل رگرسیون Y=X’b+e را در نظر بگیرید: می دانیم ماتریس واریانس-کوواریانس ضرایب تخمینی رگرسیون از رابطه زیر حاصل می شود:
σ 2 { b } = σ 2 ( X T X ) − 1 {\displaystyle \sigma ^{2}\{b\}=\sigma ^{2}(X^{T}X)^{-1}}
به منظور اندازه گیری تأثیر هم خطی بودن، استفاده از مدل رگرسیون استاندارد شده می تواند مفید واقع شود. این مدل با تبدیل متغیرها به وسیله تبدیل هم بستگی حاصل می شود. وقتی مرل رگرسیون استاندارد شده برازانیده می شود، ضرایب تخمینی رگرسیون ( b k ′ {\displaystyle b'_{k}} ) از طریق رابطه زیر به ضرایب قبل از تبدیل، مربوط می شوند:
( 2 a ) b k = ( S Y s k ) b k ′ ( k = 1 , ⋯ , p − 1 ) {\displaystyle (2a)\quad b_{k}=\left({\frac {S_{Y}}{s_{k}}}\right)b'_{k}\quad (k=1,\cdots ,p-1)}
σ 2 { b } = σ 2 ( X T X ) − 1 {\displaystyle \sigma ^{2}\{b\}=\sigma ^{2}(X^{T}X)^{-1}}
به منظور اندازه گیری تأثیر هم خطی بودن، استفاده از مدل رگرسیون استاندارد شده می تواند مفید واقع شود. این مدل با تبدیل متغیرها به وسیله تبدیل هم بستگی حاصل می شود. وقتی مرل رگرسیون استاندارد شده برازانیده می شود، ضرایب تخمینی رگرسیون ( b k ′ {\displaystyle b'_{k}} ) از طریق رابطه زیر به ضرایب قبل از تبدیل، مربوط می شوند:
( 2 a ) b k = ( S Y s k ) b k ′ ( k = 1 , ⋯ , p − 1 ) {\displaystyle (2a)\quad b_{k}=\left({\frac {S_{Y}}{s_{k}}}\right)b'_{k}\quad (k=1,\cdots ,p-1)}
wiki: عامل تورم واریانس