Module
1, Inleiding in de statistiek
Les
1.1: Beschrijvende en verklarende statistiek (tekening/animatie:
babyloniers die druk zichzelf + beesten en planten aan het tellen zijn) Er
zijn verschillende redenen waarom Babyloniërs deze volkstellingen hielden. De
voornaamste is misschien dat ze er zeker van wilden zijn dat er altijd genoeg
voedsel was voor iedereen. Daarom was het van belang om gebieden met tekorten of
overschotten snel op te sporen. Dit konden ze pas goed doen als ze niet alleen
telden maar ook hun gegevens goed ordenden en noteerden. De getelde mensen,
dieren en productie werd keurig per gebied gerangschikt en in tabellen gezet. De
Babyloniërs waren bezig met wat we nu beschrijvende
statistiek noemen. De drie belangrijkste acties binnen de beschrijvende
statistiek zijn verzamelen, organiseren en presenteren van gegevens. (tekening/animatie:
babyloniers die deze drie illustreren) Tegenwoordig
worden er nog steeds in veel landen volkstellingen gehouden. Deze volkstellingen
gaan verder dan alleen tellen van mensen en dieren. Er worden onder andere
vragen gesteld over leeftijd, godsdienst samenlevingsvormen, en onderwijs. Al
deze informatie wordt verzameld, geordend en gepubliceerd door het centraal
bureau voor de statistiek van een land. De resultaten hebben onder andere
invloed op de toewijzing van subsidies, en openbaar beleid.
Volkstellingen
betreffen nog steeds voornamelijk beschrijvende statistiek. Tegenwoordig, doen
we echter veel meer met statistiek dan alleen beschrijven. Een veel belangrijker
onderdeel van de statistiek is nu het analyseren en interpreteren van gegevens.
Dit noemen we verklarende statistiek. Veel
moderne volkstellingen voegen aan hun telling een gedetailleerde vragenlijst toe
die maar door een gedeelte van de bevolking ingevuld hoeft te worden. Deze
mensen vormen een zogenaamde
steekproef. De vragenlijst bevat vragen over bijvoorbeeld gezondheid en
politieke voorkeur. Op basis van de resultaten in de steekproef worden
uitspraken gedaan over de gehele populatie. Met andere woorden de verzamelde
gegevens worden geanalyseerd en geïnterpreteerd In
Nederland worden helemaal geen volkstellingen meer gehouden. Populatie gegevens
worden verzameld via het bevolkingsregister en verder worden veel steekproeven
gehouden door instanties zoals het Centraal Bureau voor de Statistiek (CBS). De
resultaten van deze steekproeven zijn onder andere te vinden in het statistische
jaarboek dat ieder jaar door het CBS wordt uitgegeven, en gedeeltelijk ook op
het internet (http://www.cbs.nl/). BLZ uit een recent statistisch jaarboek (liefst lengtes anders politieke voorkeur). Het
verschil tussen beschrijvende en verklarende statistiek wordt voornamelijk
bepaald door het gebruik van een steekproeven. Beschrijvende statistiek betreft
alleen het verzamelen, ordenen en presenteren van gegevens. Dit gebeurt vaak op
basis van populatie gegevens, maar dat hoeft natuurlijk niet. Je kan ook
gegevens verzameld door middel van een steekproef ordenen en presenteren.
Verklarende statistiek daarentegen maakt altijd gebruik van steekproeven. Deze
steekproeven worden gebruikt om uitspraken over populaties te doen. Dit zijn
nooit exacte uitspraken zoals de Nederlandse vrouw is 166.7896364763498 cm lang.
Dit is niet mogelijk, want je hebt nu eenmaal niet alle gegeven van de hele
populatie. Toch kan je de werkelijkheid vaak heel goed benaderen met uitspraken
zoals de Nederlandse vrouw is gemiddeld ongeveer 167 cm, of met 95%
betrouwbaarheid bevat het interval van 165 tot 169 cm de werkelijke gemiddelde
lengte van Nederlandse vrouwen. Er
zullen altijd fluctuaties optreden tussen de resultaten van verschillende
steekproeven van één populatie. Soms zijn deze fluctuaties toevallig, soms
zijn ze niet toevallig maar is de oorzaak nog onbekend. Bij nadere beschouwing
kunnen dan misschien een of meerdere factoren gevonden worden die een deel van
de fluctuaties kan verklaren. Met andere woorden, de gegevens verkregen door
steekproeven moeten worden geanalyseerd en geïnterpreteerd voor je een
betrouwbare uitspraak kan doen over de populatie. Bijna alle moderne statistiek
betreft deze vorm van statistiek. Vraag Wat
voor type statistiek betreft het publiceren van verkiezingsresultaten in de
krant? a)
Beschrijvende
statistiek b)
Verklarende
statistiek c)
Geen
van beide Antwoord a)
Ja,
het betreft hier het verzamelen, ordenen en presenteren van gegevens. Niet meer. b)
Nee,
Je hebt hier te maken met populatie gegevens die zijn verzameld, geordend en
gepresenteerd Dit is wat anders dan de vele opinie peilingen die worden
afgenomen voorafgaand aan de verkiezingen onder een deel van de bevolking. Hier
is vaak al sprake van analyse en interpretatie van gegevens en dus verklarende
statistiek. c)
Nee,
zodra je te maken hebt met gegevens, die je op zijn minst verzameld en ordent
heb je te maken met statistiek. Ga door naar les2 |