Multikollinearitet

Fra Wikipedia, den frie encyklopædi
Spring til navigation Spring til søgning

Multikollinearitet optræder typisk når for mange variable medtages i en regressionsanalyse. I den almindelige model forudsættes det, at de forklarende variable er målt uden fejl, og denne forudsætning er ofte ikke opfyldt. Relativt meget små målefejl vil nok ikke have nogen betydning, men almindelige målefejl sammen med lineære bånd mellem de forklarende variable kan resultere i nonsensresultater af en regressionsanalyse. Problemet med multikollinearitet er grundigt analyseret af Ragnar Frisch i bogen "Publikasjon nr. 5, Statistical Confluence Analysis by Means of Complete Regression Systems", Universitetets Økonomiske Institut, Oslo 1934. Bogens introduktion har overskriften: "The Object of Confluence Analysis. The danger of including too many variates in a regression analysis". "Confluence analysis" har i øvrigt de samme modelmæssige forudsætninger som faktoranalyse.

Slutbemærkning af Ragnar Frisch[redigér | redigér wikikode]

Bogen slutter med følgende bemærkning: "I do not claim that the technique developed in the present paper will, like a stone of the wise, solve all the problems of testing "significance" with which the economic statician is confronted. No statistical technique, however refined, will ever be able to do such a thing. The ultimate test of significance must consist in a network of conclusions and cross checks where theoretical economic considerations, intimate and realistic knowledge of the data and refined statistical technique concur. But I do claim that the technique here presented will in a great number of cases be very helpful. I would even venture to say that for many kinds of problems it will be indispensable – until something better is found that can replace it."