De maatregelen van centrale neiging, spreiding en positie, zijn waarden die worden gebruikt om een set statistische gegevens correct te interpreteren. Deze kunnen direct worden bewerkt, aangezien ze zijn verkregen uit de statistische studie, of ze kunnen worden georganiseerd in groepen van gelijke frequentie, wat de analyse vergemakkelijkt..
Ze maken het mogelijk om te weten rond welke waarden de statistische gegevens zijn gegroepeerd.
Het staat ook bekend als het gemiddelde van de waarden van een variabele en wordt verkregen door alle waarden op te tellen en het resultaat te delen door het totale aantal gegevens.
Laat een variabele x zijn waarvan we n gegevens hebben zonder te organiseren of te groeperen, het rekenkundig gemiddelde wordt als volgt berekend:
En in sommatie-notatie:
De eigenaren van een toeristenherberg in de bergen zijn van plan te weten hoeveel dagen de bezoekers gemiddeld in de faciliteiten verblijven. Hiervoor werd een registratie bijgehouden van de permanentie-dagen van 20 groepen toeristen, waarbij de volgende gegevens werden verkregen:
1; 1; twee; twee; 1; 4; 5; 1; 3; 4; 5; 4; 3; 1; 1; twee; twee; 3; 4; 1
Het gemiddeld aantal dagen dat toeristen verblijven is:
Als de gegevens van de variabele zijn georganiseerd in een tabel met absolute frequenties fik en de klassencentra zijn x1, Xtwee,..., xn, het gemiddelde wordt berekend door:
In sommatie-notatie:
De mediaan van een groep van n waarden van de variabele x is de centrale waarde van de groep, mits de waarden in oplopende volgorde zijn gerangschikt. Op deze manier is de helft van alle waarden kleiner dan de modus en de andere helft groter..
De volgende gevallen kunnen voorkomen:
-Aantal n waarden van de variabele x vreemd: de mediaan is de waarde die precies in het midden van de waardengroep ligt:
-Aantal n waarden van de variabele x paar-: in dit geval wordt de mediaan berekend als het gemiddelde van de twee centrale waarden van de gegevensgroep:
Om de mediaan van de gegevens van het toeristenhostel te vinden, worden ze eerst gerangschikt van laag naar hoog:
1; 1; 1; 1; 1; 1; 1; twee; twee; twee twee3; 3; 3; 4; 4; 4; 4; 5; 5
Het aantal gegevens is even, daarom zijn er twee centrale gegevens: X10 en Xelf en aangezien beide 2 waard zijn, is hun gemiddelde ook.
Mediaan = 2
De volgende formule wordt gebruikt:
De symbolen in de formule betekenen:
-c: breedte van het interval dat de mediaan bevat
-B.M.: ondergrens van hetzelfde interval
-F.m: aantal waarnemingen in het interval waartoe de mediaan behoort.
-n: totale gegevens.
-F.BM: aantal waarnemingen voordat van het interval dat de mediaan bevat.
De modus voor niet-gegroepeerde gegevens is de waarde met de hoogste frequentie, terwijl dit voor gegroepeerde gegevens de klasse met de hoogste frequentie is. Mode wordt beschouwd als de meest representatieve gegevens of klasse van de distributie.
Twee belangrijke kenmerken van deze maatregel zijn dat een dataset meer dan één modus kan hebben, en de modus kan worden bepaald voor zowel kwantitatieve als kwalitatieve gegevens..
Verdergaand met de gegevens van de toeristische parador, degene die het meest wordt herhaald is 1, daarom is het meest gebruikelijke dat toeristen 1 dag in de parador blijven.
Verspreidingsmetingen beschrijven hoe geclusterd de gegevens zijn rond de centrale metingen.
Het wordt berekend door de grootste gegevens en de kleinste gegevens af te trekken. Als dit verschil groot is, is dit een teken dat de gegevens verspreid zijn, terwijl kleine waarden aangeven dat de gegevens dicht bij het gemiddelde liggen..
Het bereik voor de gegevens van de toeristische parador is:
Bereik = 5−1 = 4
Om de variantie s te vindentwee Het is vereist om eerst het rekenkundig gemiddelde te kennen, daarna wordt het kwadraatverschil tussen elk gegeven en het gemiddelde berekend, ze worden allemaal opgeteld en gedeeld door het totale aantal waarnemingen. Deze verschillen staan bekend als afwijkingen.
De variantie, die altijd positief (of nul) is, geeft aan hoe ver de waarnemingen van het gemiddelde zijn: als de variantie hoog is, zijn de waarden meer verspreid dan wanneer de variantie klein is.
De variantie voor de gegevens van het toeristenhostel is:
1; 1; twee; twee; 1; 4; 5; 1; 3; 4; 5; 4; 3; 1; 1; twee; twee; 3; 4; 1
Om de variantie van een gegroepeerde dataset te vinden, is het volgende nodig: i) het gemiddelde, ii) de frequentie fik dat zijn de totale gegevens in elke klasse en iii) xik of klasse waarde:
De standaarddeviatie is de positieve vierkantswortel van de variantie, dus het heeft een voordeel ten opzichte van de variantie: het komt in dezelfde eenheden als de variabele die wordt bestudeerd en dus heb je een directer idee van hoe dichtbij of ver de variabele is van gemiddeld.
Het wordt eenvoudig bepaald door de vierkantswortel van de variantie voor niet-gegroepeerde gegevens te vinden:
De standaarddeviatie voor de gegevens van het toeristenhostel is:
s = √ (stwee) = √1,95 = 1,40
Het wordt berekend door de vierkantswortel van de variantie voor gegroepeerde gegevens te vinden:
Metingen van positie verdelen een geordende set gegevens in stukken van gelijke grootte. De mediaan is niet alleen een maat voor de centrale neiging, maar ook een maat voor de positie, aangezien deze het geheel in twee gelijke delen verdeelt. Maar kleinere delen kunnen worden verkregen met kwartielen, decielen en percentielen.
De kwartielen verdelen de set in vier gelijke delen die elk 25% van de gegevens bevatten. Ze worden aangeduid als Q1, Qtwee en Q3 en de mediaan is het kwartiel Qtwee. Op deze manier bevindt 25% van de gegevens zich onder het Q-kwartiel.1, 50% onder het Q-kwartieltwee of mediaan en 75% onder het Q-kwartiel3.
De gegevens zijn geordend en het totaal is verdeeld in 4 groepen met elk hetzelfde aantal gegevens. De positie van het eerste kwartiel wordt gevonden door:
Q1 = (n + 1) / 4
Waarbij n de totale gegevens is. Als het resultaat een geheel getal is, worden de gegevens die overeenkomen met die positie gelokaliseerd, maar als het decimaal is, wordt het gemiddelde van de gegevens die overeenkomen met het gehele deel met de volgende, of voor een grotere precisie wordt het lineair geïnterpoleerd tussen de genoemde gegevens.
De positie van het eerste kwartiel Q1 voor de gegevens van de toeristische parador is:
Q1 = (n + 1) / 4 = (20 + 1) / 4 = 5,25
Dit is de positie van kwartiel 1 en aangezien het resultaat decimaal is, wordt de data X doorzocht5 en X6, die respectievelijk X zijn5 = 1 en X6 = 1 en worden gemiddeld, resulterend in:
Eerste kwartiel = 1
1; 1; 1; 1; 1 11; twee; twee twee; twee; 3; 3; 3; 4; 4; 4; 4; 5; 5.
De positie van het tweede kwartiel Qtwee het is:
Qtwee = 2 (n + 1) / 4 = 10,5
Wat is het gemiddelde tussen X10 en Xelf en komt overeen met de mediaan:
Tweede kwartiel = Mediaan = 2
De positie van het derde kwartiel wordt berekend door:
Q3 = 3 (n + 1) / 4 = 3 (20 + 1) / 4 = 15,75
Het is ook decimaal, daarom wordt X gemiddeldvijftien en X16
1; 1; 1; 1; 1; 1; 1; twee; twee twee; twee; 3; 3; 3; 4 44; 4; 5; 5.
Maar aangezien beide 4 waard zijn:
Derde kwartiel = 4
De algemene formule voor de positie van kwartielen in niet-gegroepeerde gegevens is:
Qk = k (n + 1) / 4
Met k = 1,2,3.
Ze worden op dezelfde manier berekend als de mediaan:
De uitleg van de symbolen is:
-B.Q: ondergrens van het interval met het kwartiel
-c: breedte van dat interval
-F.wat: aantal waarnemingen in het kwartielinterval.
-n: totale gegevens.
-F.BQ: aantal gegevens voordat van het interval dat het kwartiel bevat.
De decielen en percentielen verdelen de dataset in respectievelijk 10 gelijke delen en 100 gelijke delen, en hun berekening wordt op dezelfde manier uitgevoerd als die van de kwartielen..
De formules worden respectievelijk gebruikt:
Dk = k (n + 1) / 10
Met k = 1,2,3… 9.
Decile D5 moet gelijk zijn aan de mediaan.
P.k = k (n + 1) / 100
Met k = 1,2,3… 99.
Het P-percentielvijftig moet gelijk zijn aan de mediaan.
In het voorbeeld van het toeristenherberg is de positie van de D3 het is:
D3 = 3 (20 + 1) / 10 = 6,3
Omdat het een decimaal getal is, wordt X gemiddeld6 en X7, beide gelijk aan 1:
1; 1; 1; 1; 1; 1 1twee; twee; twee; twee; 3; 3; 3; 4; 4; 4; 4; 5; 5
Dit betekent dat 3 tiende van de gegevens onder X ligt7 = 1 en de overige hierboven.
De formules zijn analoog aan die voor kwartielen. D wordt gebruikt om decielen aan te duiden en P voor percentielen, en de symbolen worden op dezelfde manier geïnterpreteerd:
Wanneer de gegevens symmetrisch zijn verdeeld en de distributie unimodaal is, wordt er een regel aangeroepen empirische regel of regel 68 - 95 - 99, die ze groepeert in de volgende intervallen:
In welke interval is 95% van de gegevens van de toeristenparador?
Ze bevinden zich in het interval: [2.5−1.40; 2,5 + 1,40] = [1,1; 3.9].
Niemand heeft nog op dit artikel gereageerd.