Дисперсионният инфлационен фактор (VIF) - Общ преглед, формула, приложения

Факторът на инфлационната вариация (VIF) измерва тежестта на мултиколинеарността при регресионен анализ Регресионен анализ Регресионният анализ е набор от статистически методи, използвани за оценка на връзките между зависима променлива и една или повече независими променливи. Може да се използва за оценка на силата на връзката между променливите и за моделиране на бъдещата връзка между тях. . Това е статистическа концепция, която показва увеличаването на дисперсията на коефициента на регресия в резултат на колинеарността.

Коефициент на инфлация на дисперсията

Обобщение

  • Дисперсионният инфлационен фактор (VIF) се използва за откриване на тежестта на мултиколинеарността при регресивния анализ на обикновения най-малък квадрат (OLS).
  • Мултиколинеарността надува вариацията и грешката от тип II. Това прави коефициента на променлива постоянен, но ненадежден.
  • VIF измерва броя на завишени вариации, причинени от мултиколинеарност.

Дисперсионният инфлационен фактор и мултиколинеарност

В обикновения регресионен анализ на най-малкия квадрат (OLS), мултиколинеарността съществува, когато две или повече от независимите променливи Независима променлива Независима променлива е вход, предположение или драйвер, който се променя, за да се оцени въздействието му върху зависима променлива (резултатът) . демонстрират линейна връзка между тях. Например, за да се анализира връзката между фирмените размери и приходите с цените на акциите в регресионен модел, пазарната капитализация и приходите са независимите променливи.

Пазарна капитализация на компанията Пазарна капитализация Пазарната капитализация (пазарна капитализация) е най-новата пазарна стойност на акциите на компанията в обращение. Пазарната капитализация е равна на текущата цена на акциите, умножена по броя на акциите в обращение. Инвестиционната общност често използва стойността на пазарната капитализация, за да класира компаниите и нейните общи приходи са силно свързани. Тъй като компанията печели все по-големи приходи, тя също нараства по размер. Това води до проблем с мултиколинеарност в регресионния анализ на OLS. Ако независимите променливи в регресионния модел показват напълно предсказуема линейна връзка, това е известно като перфектна мултиколинеарност.

При мултиколинеарността коефициентите на регресия все още са постоянни, но вече не са надеждни, тъй като стандартните грешки са завишени. Това означава, че предсказуемата мощност на модела не е намалена, но коефициентите може да не са статистически значими с грешка тип II Грешка тип II При тестване на статистическа хипотеза грешка тип II е ситуация, при която тестът за хипотеза не успява да отхвърли нулевата хипотеза, че е невярно. С други .

Следователно, ако коефициентите на променливите не са индивидуално значими - не могат да бъдат отхвърлени съответно в t-теста - но могат съвместно да обяснят дисперсията на зависимата променлива с отхвърляне в F-теста и висок коефициент на определяне (R2), мултиколинеарност може да съществува. Това е един от методите за откриване на мултиколинеарност.

VIF е друг често използван инструмент за откриване дали мултиколинеарността съществува в регресионен модел. Той измерва доколко вариацията (или стандартната грешка) на изчисления коефициент на регресия е завишена поради колинеарност.

Използване на дисперсионния фактор на инфлация

VIF може да се изчисли по формулата по-долу:

Дисперсионният фактор на инфлация - формула

Където R i 2 представлява некоригиран коефициент на детерминация за регресия на i-тата независима променлива върху останалите. Взаимното на VIF е известно като толерантност . За откриване на мултиколинеарност може да се използва или VIF, или толерантност, в зависимост от личните предпочитания.

Ако R i 2 е равно на 0, дисперсията на останалите независими променливи не може да се предвиди от i-тата независима променлива. Следователно, когато VIF или толеранс е равен на 1, i-тата независима променлива не е свързана с останалите, което означава, че мултиколинеарността не съществува в този модел на регресия. В този случай дисперсията на i-ия регресионен коефициент не е завишена.

Като цяло, VIF над 4 или толеранс под 0,25 показва, че може да съществува мултиколинеарност и е необходимо допълнително проучване. Когато VIF е по-висок от 10 или толерансът е по-нисък от 0,1, има значителна мултиколинеарност, която трябва да бъде коригирана.

Съществуват обаче и ситуации, при които високите VFI могат безопасно да бъдат игнорирани, без да страдат от мултиколинеарност. Следват три такива ситуации:

1. Високи VIF съществуват само в контролни променливи, но не и в променливи от интерес. В този случай променливите от интерес не са колинеарни една спрямо друга или контролните променливи. Коефициентите на регресия не се влияят.

2. Когато високи VIF са причинени в резултат на включването на продуктите или мощностите на други променливи, мултиколинеарността не причинява отрицателни въздействия. Например, регресионният модел включва както x, така и x2 като свои независими променливи.

3. Когато фиктивна променлива, която представлява повече от две категории, има висок VIF, мултиколинеарност не е задължително да съществува. Променливите винаги ще имат високи VIF, ако има малка част от случаите в категорията, независимо дали категориалните променливи са свързани с други променливи.

Корекция на мултиколинеарността

Тъй като мултиколинеарността надува дисперсията на коефициентите и причинява грешки от тип II, от съществено значение е тя да бъде открита и коригирана. Има два прости и често използвани начина за коригиране на мултиколинеарността, изброени по-долу:

1. Първият е да премахнете една (или повече) от силно корелираните променливи. Тъй като информацията, предоставена от променливите, е излишна, коефициентът на определяне няма да бъде силно нарушен от премахването.

2. Вторият метод е да се използва анализ на основните компоненти (PCA) или частична регресия с най-малък квадрат (PLS) вместо регресия на OLS. PLS регресията може да намали променливите до по-малък набор без корелация между тях. В PCA се създават нови некорелирани променливи. Той свежда до минимум загубата на информация и подобрява предвидимостта на даден модел.

Още ресурси

Finance е официален доставчик на глобалния сертифициран банков и кредитен анализатор (CBCA) ™ CBCA ™ сертифициране Сертифицираният банков и кредитен анализатор (CBCA) ™ акредитация е глобален стандарт за кредитни анализатори, който обхваща финанси, счетоводство, кредитен анализ, анализ на паричните потоци , моделиране на завети, изплащане на заеми и др. програма за сертифициране, предназначена да помогне на всеки да стане финансов анализатор от световна класа. За да продължите да напредвате в кариерата си, допълнителните ресурси по-долу ще бъдат полезни:

  • Основни понятия за статистика във финансите Основни понятия за статистика за финанси Солидното разбиране на статистиката е от решаващо значение, за да ни помогне да разберем по-добре финансите. Освен това концепциите за статистика могат да помогнат на инвеститорите да наблюдават
  • Методи за прогнозиране Методи за прогнозиране Топ методи за прогнозиране. В тази статия ще обясним четири вида методи за прогнозиране на приходите, които финансовите анализатори използват за прогнозиране на бъдещи приходи.
  • Множествена линейна регресия Множествена линейна регресия Многократна линейна регресия се отнася до статистическа техника, използвана за прогнозиране на резултата от зависима променлива въз основа на стойността на независимите променливи
  • Случайна променлива Случайна променлива Случайна променлива (стохастична променлива) е вид променлива в статистиката, чиито възможни стойности зависят от резултатите от дадено случайно явление