BelStat home

Module 1

les 2

les 3

Module 1, Inleiding in de statistiek

 

Les 1.1: Beschrijvende en verklarende statistiek
Bijna 6000 jaar geleden waren de Babyloniërs al met statistiek bezig. Iedere 6 a 7 jaar werden alle Babyloniërs, hun veestapel en agrarische productie geteld. Waarom deden de Babyloniërs dit?

(tekening/animatie: babyloniers die druk zichzelf + beesten en planten aan het tellen zijn)

Er zijn verschillende redenen waarom Babyloniërs deze volkstellingen hielden. De voornaamste is misschien dat ze er zeker van wilden zijn dat er altijd genoeg voedsel was voor iedereen. Daarom was het van belang om gebieden met tekorten of overschotten snel op te sporen. Dit konden ze pas goed doen als ze niet alleen telden maar ook hun gegevens goed ordenden en noteerden. De getelde mensen, dieren en productie werd keurig per gebied gerangschikt en in tabellen gezet.

De Babyloniërs waren bezig met wat we nu beschrijvende statistiek noemen. De drie belangrijkste acties binnen de beschrijvende statistiek zijn verzamelen, organiseren en presenteren van gegevens.

(tekening/animatie: babyloniers die deze drie illustreren)

Tegenwoordig worden er nog steeds in veel landen volkstellingen gehouden. Deze volkstellingen gaan verder dan alleen tellen van mensen en dieren. Er worden onder andere vragen gesteld over leeftijd, godsdienst samenlevingsvormen, en onderwijs. Al deze informatie wordt verzameld, geordend en gepubliceerd door het centraal bureau voor de statistiek van een land. De resultaten hebben onder andere invloed op de toewijzing van subsidies, en openbaar beleid. 

Volkstellingen betreffen nog steeds voornamelijk beschrijvende statistiek. Tegenwoordig, doen we echter veel meer met statistiek dan alleen beschrijven. Een veel belangrijker onderdeel van de statistiek is nu het analyseren en interpreteren van gegevens. Dit noemen we verklarende statistiek.

Veel moderne volkstellingen voegen aan hun telling een gedetailleerde vragenlijst toe die maar door een gedeelte van de bevolking ingevuld hoeft te worden. Deze mensen vormen  een zogenaamde steekproef. De vragenlijst bevat vragen over bijvoorbeeld gezondheid en politieke voorkeur. Op basis van de resultaten in de steekproef worden uitspraken gedaan over de gehele populatie. Met andere woorden de verzamelde gegevens worden geanalyseerd en geïnterpreteerd

In Nederland worden helemaal geen volkstellingen meer gehouden. Populatie gegevens worden verzameld via het bevolkingsregister en verder worden veel steekproeven gehouden door instanties zoals het Centraal Bureau voor de Statistiek (CBS). De resultaten van deze steekproeven zijn onder andere te vinden in het statistische jaarboek dat ieder jaar door het CBS wordt uitgegeven, en gedeeltelijk ook op het internet (http://www.cbs.nl/).

 BLZ uit een recent statistisch jaarboek (liefst lengtes anders politieke voorkeur).

Het verschil tussen beschrijvende en verklarende statistiek wordt voornamelijk bepaald door het gebruik van een steekproeven. Beschrijvende statistiek betreft alleen het verzamelen, ordenen en presenteren van gegevens. Dit gebeurt vaak op basis van populatie gegevens, maar dat hoeft natuurlijk niet. Je kan ook gegevens verzameld door middel van een steekproef ordenen en presenteren. Verklarende statistiek daarentegen maakt altijd gebruik van steekproeven. Deze steekproeven worden gebruikt om uitspraken over populaties te doen. Dit zijn nooit exacte uitspraken zoals de Nederlandse vrouw is 166.7896364763498 cm lang. Dit is niet mogelijk, want je hebt nu eenmaal niet alle gegeven van de hele populatie. Toch kan je de werkelijkheid vaak heel goed benaderen met uitspraken zoals de Nederlandse vrouw is gemiddeld ongeveer 167 cm, of met 95% betrouwbaarheid bevat het interval van 165 tot 169 cm de werkelijke gemiddelde lengte van Nederlandse vrouwen.

Er zullen altijd fluctuaties optreden tussen de resultaten van verschillende steekproeven van één populatie. Soms zijn deze fluctuaties toevallig, soms zijn ze niet toevallig maar is de oorzaak nog onbekend. Bij nadere beschouwing kunnen dan misschien een of meerdere factoren gevonden worden die een deel van de fluctuaties kan verklaren. Met andere woorden, de gegevens verkregen door steekproeven moeten worden geanalyseerd en geïnterpreteerd voor je een betrouwbare uitspraak kan doen over de populatie. Bijna alle moderne statistiek betreft deze vorm van statistiek.

Vraag

Wat voor type statistiek betreft het publiceren van verkiezingsresultaten in de krant?

 

a)      Beschrijvende statistiek

b)      Verklarende statistiek

c)      Geen van beide

 

Antwoord

 

a)      Ja, het betreft hier het verzamelen, ordenen en presenteren van gegevens. Niet meer.

b)      Nee, Je hebt hier te maken met populatie gegevens die zijn verzameld, geordend en gepresenteerd Dit is wat anders dan de vele opinie peilingen die worden afgenomen voorafgaand aan de verkiezingen onder een deel van de bevolking. Hier is vaak al sprake van analyse en interpretatie van gegevens en dus verklarende statistiek.

c)      Nee, zodra je te maken hebt met gegevens, die je op zijn minst verzameld en ordent heb je te maken met statistiek.

Ga door naar les2