Multikolinearnost je problem, ker spodkopava statistični pomen neodvisne spremenljivke. Če so druge stvari enake, večja kot je standardna napaka regresijskega koeficienta, manj verjetno je, da bo ta koeficient statistično pomemben.
Kako veš, ali je multikolinearnost problem?
Eden od načinov za merjenje multikolinearnosti je faktor inflacije variance (VIF), ki oceni, za koliko se poveča varianca ocenjenega regresijskega koeficienta, če so vaši napovedovalci povezani. … VIF med 5 in 10 označuje visoko korelacijo, ki je lahko problematična.
Je kolinearnost problem za napovedovanje?
Multikolinearnost je še vedno problem za napovedno moč. Vaš model bo preobremenjen in manj verjetno, da bo posplošil na podatke izven vzorca. Na srečo vaš R2 ne bo prizadet in vaši koeficienti bodo še vedno nepristranski.
Zakaj je kolinearnost problem v regresiji?
Multikolinearnost zmanjša natančnost ocenjenih koeficientov, kar oslabi statistično moč vašega regresijskega modela. Morda ne boste mogli zaupati p-vrednostim za identifikacijo neodvisnih spremenljivk, ki so statistično pomembne.
Kdaj prezreti kolinearnost?
Poveča standardne napake njihovih koeficientov in lahko povzroči, da so ti koeficienti nestabilni na več načinov. Toda dokler je kolinearspremenljivke se uporabljajo samo kot kontrolne spremenljivke in niso kolinearne s spremenljivkami, ki vas zanimajo, ni problema.