Wat is rangschikking in statistieken? (Met voorbeelden)

3558
Robert Johnston

De rang, afstand of amplitude, in statistieken, is het verschil (aftrekken) tussen de maximale waarde en de minimale waarde van een set gegevens van een steekproef of een populatie. Als het bereik wordt weergegeven door de letter R en de gegevens door X, de formule voor het assortiment is simpelweg:

R = xmax. hoogte - Xmin

 Waar xmax. hoogte is de maximale waarde van de gegevens en xmin is het minimum.

Figuur 1. Gegevensbereik dat overeenkomt met de bevolking van Cádiz in de afgelopen twee eeuwen. Bron: Wikimedia Commons.

Het concept is erg handig als een eenvoudige maat voor spreiding om snel de variabiliteit van de gegevens te beoordelen, aangezien het de verlenging of lengte aangeeft van het interval waarin deze worden gevonden..

Stel dat de lengte van een groep van 25 mannelijke eerstejaars technische studenten aan een universiteit wordt gemeten. De langste leerling in de groep is 1,93 m en de kortste 1,67 m. Dit zijn de extreme waarden van de voorbeeldgegevens, daarom is hun pad:

R = 1,93 - 1,67 m = 0,26 m of 26 cm.

De lengte van de leerlingen in deze groep wordt over dit bereik verdeeld.

Artikel index

  • 1 Voordelen en nadelen
    • 1.1 Nadelen van bereik als maat voor spreiding
  • 2 Interkwartielbereik, kwartielen en uitgewerkt voorbeeld
    • 2.1 - Berekening van kwartielen
  • 3 Uitgewerkt voorbeeld
  • 4 referenties

Voor-en nadelen

Bereik is, zoals we eerder zeiden, een maatstaf voor hoe verspreid de gegevens zijn. Een klein bereik geeft aan dat de gegevens min of meer dichtbij zijn en dat er weinig spreiding is. Aan de andere kant is een groter bereik een indicatie dat de gegevens meer verspreid zijn..

De voordelen van het berekenen van het bereik liggen voor de hand: het is heel eenvoudig en snel te vinden, omdat het een eenvoudig verschil is.

Het heeft ook dezelfde eenheden als de gegevens waarmee het werkt en het concept is voor elke waarnemer heel gemakkelijk te interpreteren..

In het voorbeeld van de lengte van ingenieursstudenten, als het bereik 5 cm was geweest, zouden we zeggen dat de studenten allemaal ongeveer even groot zijn. Maar met een bereik van 26 cm gaan we er meteen vanuit dat er leerlingen van alle tussenliggende hoogtes in de steekproef zitten. Is deze aanname altijd correct??

Nadelen van bereik als maat voor spreiding

Als we goed kijken, kan het zijn dat in onze steekproef van 25 ingenieursstudenten, slechts één van hen 1,93 meet en de overige 24 een hoogte hebben van bijna 1,67 m..

En toch blijft het bereik hetzelfde, al is het omgekeerde perfect mogelijk: dat de hoogte van de meerderheid ongeveer 1,90 m is en slechts één 1,67 m.

In beide gevallen is de verdeling van de gegevens behoorlijk verschillend.

De nadelen van bereik als maat voor spreiding zijn dat het alleen extreme waarden gebruikt en alle andere negeert. Aangezien de meeste informatie verloren gaat, heeft u geen idee hoe de voorbeeldgegevens worden verdeeld.

Een ander belangrijk kenmerk is dat het bereik van de sample nooit afneemt. Als we meer informatie toevoegen, dat wil zeggen dat we meer gegevens overwegen, wordt het bereik groter of blijft het hetzelfde.

En in ieder geval is het alleen nuttig bij het werken met kleine monsters, het enige gebruik ervan als maat voor verspreiding in grote monsters wordt niet aanbevolen..

Wat u moet doen is aanvullen met de berekening van andere spreidingsmaatregelen die wel rekening houden met de informatie die door de totale gegevens wordt verstrekt: route interkwartiel, variantie, standaarddeviatie en variatiecoëfficiënt.

Interkwartielbereik, kwartielen en uitgewerkt voorbeeld

We hebben ons gerealiseerd dat de zwakte van het bereik als maat voor spreiding is dat het alleen gebruik maakt van de extreme waarden van de datadistributie en de andere weglaat..

Om dit ongemak te voorkomen, kan de kwartielen: drie waarden die bekend staan ​​als positiemetingen.

Ze verdelen de niet-gegroepeerde gegevens in vier delen (andere veelgebruikte positiematen zijn decielen en de percentielen​Dit zijn de kenmerken:

-Het eerste kwartiel Q1 is de waarde van de gegevens zodanig dat 25% van alle gegevens kleiner is dan Q1.

-Het tweede kwartiel Qtwee is de mediaan- van de verdeling, wat betekent dat de helft (50%) van de gegevens kleiner is dan die waarde.

-Eindelijk het derde kwartiel Q3 wijst erop dat 75% van de gegevens minder zijn dan Q3.

Vervolgens wordt het interkwartielbereik of interkwartielbereik gedefinieerd als het verschil tussen het derde kwartiel Q3 en het eerste kwartiel Q1 van de gegevens:

Interkwartielbereik = RQ = Q3 - Q1

Op deze manier wordt de waarde van het bereik RQ het wordt niet zo beïnvloed door extreme waarden. Om deze reden is het raadzaam om het te gebruiken bij scheve distributies, zoals die van zeer lange of zeer korte studenten die hierboven zijn beschreven..

- Berekening van kwartielen

Er zijn verschillende manieren om ze te berekenen, hier zullen we er een voorstellen, maar het is in ieder geval noodzakelijk om de aantal bestelling "Nof”, Dat is de plaats die het respectievelijke kwartiel inneemt in de distributie.

Dat wil zeggen, als bijvoorbeeld de term die overeenkomt met Q1 is de tweede, derde of vierde enzovoort van de distributie.

Eerste kwartiel

Nof (Q1) = (N + 1) / 4

Tweede kwartiel of mediaan

Nof (Qtwee) = (N + 1) / 2

Derde kwartiel

Nof (Q3) = 3 (N + 1) / 4

Waar N het aantal gegevens is.

De mediaan is de waarde die precies in het midden van de verdeling ligt. Als het aantal gegevens oneven is, is het geen probleem om het te vinden, maar als het even is, worden de twee centrale waarden gemiddeld om één te worden.

Nadat het bestelnummer is berekend, wordt een van deze drie regels gevolgd:

-Als het geen decimalen heeft, worden de gegevens die in de distributie worden aangegeven doorzocht en dit wordt het kwartiel dat wordt doorzocht.

-Als het volgnummer halverwege tussen twee ligt, worden de gegevens die worden aangegeven door het gehele deel, gemiddeld met de volgende gegevens en is het resultaat het overeenkomstige kwartiel.

-In elk ander geval wordt het afgerond op het dichtstbijzijnde gehele getal en dat is de positie van het kwartiel.

Uitgewerkt voorbeeld

Op een schaal van 0 tot 20 behaalde een groep van 16 wiskunde I-studenten de volgende punten (punten) op een tussentijds examen:

16, 10, 12, 8, 9, 15, 18, 20, 9, 11, 1, 13, 17, 9, 10, 14

Vind:

a) Het bereik of bereik van de gegevens.

b) De waarden van de kwartielen Q1 en Q3

c) Het interkwartielbereik.

Figuur 2. Hebben de scores op deze wiskundetoets zoveel variabiliteit? Bron: Pixabay.

Oplossing voor

Het eerste dat u moet doen om het pad te vinden, is door de gegevens in oplopende of aflopende volgorde te ordenen. Zo heb je in oplopende volgorde:

1, 8, 9, 9, 9, 10, 10, 11, 12, 13, 14, 15, 16, 17, 18, 20

Gebruik de formule die aan het begin is gegeven: R = xmax. hoogte - Xmin

R = 20 - 1 punten = 19 punten.

Volgens het resultaat zijn deze kwalificaties sterk verspreid.

Oplossing b

N = 16

Nof (Q1) = (N + 1) / 4 = (16 + 1) / 4 = 17/4 = 4,25

Het is een getal met decimalen, waarvan het gehele deel 4 is. Dan gaan we naar de verdeling, we zoeken de gegevens die op de vierde plaats staan ​​en de waarde wordt gemiddeld met die van de vijfde positie. Omdat ze allebei 9 zijn, is het gemiddelde ook 9 en dus:

Q1 = 9

Nu herhalen we de procedure om Q te vinden3

Nof (Q3) = 3 (N + 1) / 4 = 3 (16 +1) / 4 = 12,75

Het is weer een decimaal, maar aangezien het niet halverwege is, wordt het afgerond op 13. Het kwartiel dat we zoeken neemt de dertiende positie in en is:

Q3 = 16

Oplossing c

RQ = Q3 - Q1 = 16 - 9 = 7 punten.

Wat, zoals we zien, veel kleiner is dan het bereik van gegevens berekend in sectie a), omdat de minimumscore 1 punt was, een waarde die veel verder verwijderd is van de rest..

Referenties

  1. Berenson, M. 1985. Statistieken voor management en economie. Interamericana S.A.
  2. Canavos, G. 1988. Waarschijnlijkheid en statistiek: toepassingen en methoden. Mcgraw heuvel.
  3. Devore, J. 2012. Waarschijnlijkheid en statistiek voor techniek en wetenschap. 8e. Editie. Cengage.
  4. Voorbeelden van kwartielen. Hersteld van: matematicas10.net.
  5. Levin, R. 1988. Statistieken voor beheerders. 2e. Editie. Prentice hal.
  6. Walpole, R. 2007. Waarschijnlijkheid en statistiek voor techniek en wetenschappen. Pearson.

Niemand heeft nog op dit artikel gereageerd.