Statistisch onderzoek: wat is het verschil tussen meetniveaus?
Stel je meneer Visser voor. Meneer Visser werkt als verkeerswetenschapper aan een Nederlandse universiteit. Hij wil onderzoeken hoe de meeste mensen in Nederland naar hun werk gaan. Is dat met de fiets of met de auto? Of gaan ze lopend? Maakt het eigenlijk uit hoe oud iemand is, wat voor beroep iemand heeft, hoe ver iemand van zijn werk woont en of iemand een man of vrouw is? Meneer Visser is nieuwsgierig en zet een onderzoek op.
Statistisch onderzoek
De wetenschapper kan een paar mensen vragen hoe ze naar hun werk gaan, bijvoorbeeld zijn buren. Maar dan kan hij eigenlijk geen goede uitspraak doen over hoe het grootste gedeelte van werkend Nederland naar het werk gaat. Hij weet het dan alleen van zijn buren. Daarom zal de wetenschapper zoveel mogelijk gegevens van een grote groep werkende mensen willen verzamelen. Hij kan niet bij elke Nederlander aanbellen. Gelukkig weet hij hier iets op. Hij maakt een vragenlijst die hij naar een grote groep mensen stuurt. De gegevens die terugkomen, analyseert hij met behulp van statistische methoden.
Variabelen
In de vragenlijst die de wetenschapper stuurt, staan vragen. In die vragen zijn variabelen verwerkt. Een variabele is een gegeven waarvan de waarde kan verschillen. Neem nou de vraag met welk vervoersmiddel de meeste mensen naar hun werk gaan. Mensen kunnen antwoorden: ‘auto’, ‘fiets’ of ‘lopend’. Vervoersmiddel is een variabele. Het is immers een gegeven dat kan variëren: het kan de auto, de fiets of lopend zijn. Ook woon-werkafstand is een variabele, het aantal kilometers dat iemand van zijn werk woont, kan immers verschillen. Het kan 1 kilometer zijn, maar ook 50 kilometer. Geslacht is ook een variabele, je kunt een man of een vrouw zijn.
Meetniveaus
De waarde die een variabele aan kan nemen, heeft een bepaald meetniveau (ook wel meetschaal genoemd). De waarde van de variabele ‘Geslacht’ is bijvoorbeeld man of vrouw. Het meetniveau van een variabele vertelt meneer Visser welke statistische methoden hij kan gebruiken om de gegevens te analyseren. De vier meetniveaus zijn: nominaal, ordinaal, interval en ratio. Laten we eens kijken wat het verschil is tussen de verschillende meetniveaus.
Nominaal
Bij een nominaal meetniveau heeft een variabele waarden die van hetzelfde niveau zijn. Bijvoorbeeld bij de variabele geslacht, staan de waarden ‘Man’ en ‘Vrouw’ op hetzelfde niveau. Er zijn verschillende categorieën, maar er is geen verschil tussen die waarden. Ze worden alleen benoemd. Hetzelfde geldt ook voor de variabele ‘Vervoersmiddel’, ook die heeft een nominaal meetniveau. ‘Fiets’, ‘Auto’ en ‘Lopend’ zijn verschillende categorieën, maar ze verschillen niet van elkaar qua aanwijsbare waarde.
Ordinaal
Bij een variabele met een ordinaal meetniveau zit wel verschil tussen de verschillende waarden. Denk bijvoorbeeld aan opleidingsniveau. De waarden kunnen dan ‘vmbo’, ‘havo’ en ‘vwo’ zijn. Er is geen heel duidelijk verschil tussen deze categorieën, maar je zou voorzichtig kunnen zeggen dat het een hoger is dan het ander.
Interval
Bij een variabele met waarden van het meetniveau interval, is er een duidelijk verschil tussen de verschillende waarden. Stel dat meneer Visser in zijn wetenschappelijk onderzoek wil kijken of het uitmaakt hoe laat mensen op hun werk moeten zijn. Dit tijdstip kan namelijk verschillen en invloed hebben op je keuze voor je vervoersmiddel en hoe je naar je werk gaat. Misschien moet de één om 8 uur op zijn werk zijn en een ander pas om 10 uur. De variabele ‘Tijdstip’ is van interval meetniveau: er zit een duidelijk verschil tussen 8 en 10 uur. Namelijk een verschil van 2 uur, of 120 minuten.
Belangrijke regel bij een variabele met het meetniveau interval, is dat de waarde nooit ‘het nulpunt’ kan betekenen. De waarde kan ‘0’ zijn, maar dit betekent dan niet ‘afwezigheid’. Bij de variabele temperatuur kan de waarde bijvoorbeeld best ‘0’ zijn, maar dat betekent niet dat er geen temperatuur is. De temperatuur is dan nul graden. In het geval van het tijdstip dat meneer Visser wil meten, zal 0 uur bijvoorbeeld midden in de nacht betekenen. Onwaarschijnlijk dat iemand dat zal invullen in de vragenlijst, maar het zou kunnen.
Ratio
Het laatste meetniveau, is ‘ratio’. Een variabele van dit meetniveau heeft ook waarden waar een duidelijk verschil tussen zit. Het verschil kun je net als bij de intervalvariabele, heel duidelijk aangeven. Het verschil tussen een variabele van interval- en van ratiomeetniveau is dat er bij een ratiomeetniveau wél een absoluut nulpunt is. Als de waarde bij variabele van het meetniveau ratio 0 is, dan betekent dit dat de waarde afwezig is. Denk bijvoorbeeld aan percentages of inkomen. Met een ratiomeetniveau is het daarom mogelijk om te rekenen met verhoudingen tussen verschillende waarden op schaal.
Berekeningen
Meneer Visser heeft zijn vragenlijsten teruggekregen en de antwoorden op de vragen heeft hij in een statistisch rekenprogramma gezet. Nu kan hij berekeningen gaan maken. Met elke variabele gaat hij een beetje anders om. Omdat hij een cijfermatig onderzoek doet, heeft hij vooral veel aan de interval- en ratiomeetniveaus. Daarmee kan hij tellen en aangeven wat hoog is en wat laag en wat het gemiddelde is. Ook kan hij de spreiding van de waarden aangeven. De nominale variabele kan hij alleen tellen en hij kan hiervan percentages uitrekenen. Bijvoorbeeld hoeveel vrouwen en hoeveel mannen hebben de vragenlijst ingevuld en hoeveel gaan met de auto, fiets of lopend? Ook de ordinale variabele kan hij tellen en hij kan de percentages ervan berekenen. Ook kan hij aangeven welke waarde hoger is en lager.