Steekproefgewichten en het verlies aan nauwkeurigheid

·
Luister naar dit artikel~3 min
Steekproefgewichten en het verlies aan nauwkeurigheid

Van populatiegemiddelden naar voorwaardelijke gemiddelden E(Y|X). We bespreken steekproefgewichten, de logit shift en de verrassende parallellen tussen enquĂȘtestatistiek en causale inferentie. Hoe schat je nauwkeurig en wat zijn de valkuilen?

We hebben het de laatste tijd vooral gehad over het populatiegemiddelde E(Y) als onze belangrijkste grootheid. Dat is vaak waar we naartoe werken. Maar wat als we specifieker willen zijn? We zagen al hoe methodes zich uitbreiden naar het schatten van een subgroepgemiddelde, zoals E(Y | V=1). Denk aan een specifieke groep zoals kiezers. Dat werkt prima. Maar dan komt de volgende vraag: hoe schat je een algemeen voorwaardelijk gemiddelde E(Y | X)? Daar hebben we het veel over gehad, bijvoorbeeld in vier eerdere posts over het kalibreren hiervan aan een bekend populatiegemiddelde E(Y). De 'logit shift' is daar een bekend voorbeeld van. Maar laten we bij het begin beginnen. Eerst moeten we een goede schatting van E(Y | X) uit onze enquĂȘtegegevens halen. Dat is de basis. ### De theorie volgens Lumley In Sectie 5.2 van Lumley (2010) wordt dit grondig behandeld. Het gaat over het wegen van steekproeven om vertekening tegen te gaan. Het idee is om observaties die ondervertegenwoordigd zijn in je steekproef zwaarder te laten wegen. Zo kom je dichter bij de werkelijke populatie. Het is een krachtig concept, maar niet zonder uitdagingen. Het toepassen van gewichten kan de variantie van je schattingen verhogen. Je wint aan nauwkeurigheid op het ene vlak, maar verliest soms aan stabiliteit op een ander. Een afweging die je altijd moet maken. ### Een verrassende vondst en een verband Laatst dook ik weer eens in een stapel oude papers. Tussen al die artikelen vond ik iets interessants. Het deed me meteen denken aan een tekening die ik eerder maakte, geĂŻnspireerd op Figuur 3 uit Johansson et al. (2022). Het leuke is dat je de variabele R (of je reageert op een enquĂȘte) kunt vervangen door T (of je een behandeling krijgt). Plotseling zie je een parallel. Het laat zien hoe methodes uit verschillende vakgebieden op elkaar lijken. - Vervang 'survey response' door 'treatment assignment'. - De logica van gewichten en vertekening blijft grotendeels hetzelfde. - Het gaat steeds om het corrigeren voor factoren die je meting beĂŻnvloeden. Die tekening was dus niet zomaar een schets. Het visualiseerde een fundamenteel verband. ### De brug tussen vakgebieden We hebben het al vaker gehad over de connecties tussen willekeurige steekproeven voor enquĂȘtes en gerandomiseerde experimenten. Die analogie is sterk. Maar er is meer. Ook tussen niet-kanssteekproeven en observationele studies zijn duidelijke parallellen te trekken. Beide kampen met het probleem van verstorende variabelen. Hoe isoleren we het effect dat we echt willen meten? > "De kunst van het analyseren zit vaak in het herkennen van patronen die zich over disciplines heen herhalen." We gaan deze analogieĂ«n tussen enquĂȘtestatistiek en causale inferentie verder verkennen. Het is een rijke bron van inzichten. Methodes ontwikkeld voor het ene probleem blijken vaak verrassend goed toepasbaar op het andere. Welke referenties vind jij onmisbaar op dit snijvlak? Welk boek of artikel heeft jouw denken hierover het meest gevormd? Deel het vooral. Laten we de discussie voortzetten en van elkaar leren. Want uiteindelijk draait het allemaal om het beter begrijpen van de wereld om ons heen, via data.