Class Markeer waarvoor het is, hoe u het kunt krijgen en voorbeelden

4470
Jonah Lester

De klasse merk, Ook bekend als het middelpunt, is het de waarde die in het midden van een klasse staat en die alle waarden in die categorie vertegenwoordigt. In wezen wordt het klassencijfer gebruikt om bepaalde parameters te berekenen, zoals het rekenkundig gemiddelde of de standaarddeviatie..

Het klassenteken is dus het middelpunt van een interval. Deze waarde is ook erg handig om de variantie te vinden van een set gegevens die al in klassen is gegroepeerd, waardoor we op hun beurt kunnen begrijpen hoe ver deze specifieke gegevens van het centrum verwijderd zijn..

Artikel index

  • 1 Frequentieverdeling
    • 1.1 Hoeveel klassen te overwegen?
  • 2 Hoe kom je aan?
    • 2.1 Voorbeeld
  • 3 Waar is het voor?
    • 3.1 Voorbeeld
  • 4 referenties

Frequentieverdeling

Om te begrijpen wat een klassekenmerk is, is het concept van frequentieverdeling noodzakelijk. Gegeven een set gegevens is een frequentieverdeling een tabel die de gegevens verdeelt in een aantal categorieën, klassen genaamd..

Deze tabel toont het aantal elementen dat bij elke klasse hoort; de laatste staat bekend als frequentie.

In deze tabel wordt een deel van de informatie die we uit de gegevens halen opgeofferd, omdat we in plaats van de individuele waarde van elk element te hebben, alleen weten dat het tot die klasse behoort.

Aan de andere kant krijgen we een beter begrip van de dataset, omdat het op deze manier gemakkelijker is om gevestigde patronen te waarderen, wat de manipulatie van die data vergemakkelijkt..

Hoeveel klassen te overwegen?

Om een ​​frequentieverdeling te maken, moeten we eerst het aantal klassen bepalen dat we willen volgen en hun klassenlimieten kiezen..

Het kiezen van het aantal klassen dat moet worden gevolgd, zou handig moeten zijn, rekening houdend met het feit dat een klein aantal klassen informatie kan verbergen over de gegevens die we willen bestuderen en een zeer grote kan te veel details genereren die niet noodzakelijkerwijs nuttig zijn.

De factoren waarmee we rekening moeten houden bij het kiezen van het aantal klassen dat we willen volgen, zijn verschillende, maar van deze twee vallen op: de eerste is om rekening te houden met hoeveel gegevens we moeten overwegen; de tweede is om te weten hoe groot het bereik van de distributie is (dat wil zeggen, het verschil tussen de grootste en de kleinste waarneming).

Nadat we de klassen al hebben gedefinieerd, gaan we verder met tellen hoeveel gegevens er in elke klasse zijn. Dit nummer wordt de frequentie van klassen genoemd en wordt aangeduid met fi.

Zoals we eerder hadden gezegd, hebben we dat een frequentieverdeling de informatie verliest die individueel uit elke gegevens of observatie komt. Om deze reden wordt een waarde gezocht die de hele klasse vertegenwoordigt waartoe hij behoort; deze waarde is het klassenteken.

Hoe wordt het verkregen?

Het klassenteken is de kernwaarde die een klasse vertegenwoordigt. Het wordt verkregen door de limieten van het interval op te tellen en deze waarde door twee te delen. We zouden dit wiskundig als volgt kunnen uitdrukken:

Xik= (Ondergrens + bovengrens) / 2.

In deze uitdrukking xik geeft het merkteken van de i-de klasse aan.

Voorbeeld

Geef, uitgaande van de volgende set gegevens, een representatieve frequentieverdeling en verkrijg het cijfer van de overeenkomstige klassen.

Aangezien de gegevens met de hoogste numerieke waarde 391 zijn en de laagste 221, is het bereik 391-221 = 170.

We zullen 5 klassen kiezen, allemaal met dezelfde grootte. Een manier om klassen te kiezen is als volgt:

Merk op dat elke gegevens zich in een klasse bevinden, deze zijn onsamenhangend en hebben dezelfde waarde. Een andere manier om de klassen te kiezen, is door de gegevens te beschouwen als onderdeel van een continue variabele, die elke werkelijke waarde kan bereiken. In dit geval kunnen we klassen van de vorm overwegen:

205-245, 245-285, 285-325, 325-365, 365-405

Deze manier van groeperen van gegevens kan echter enkele onduidelijkheden opleveren. In het geval van 245 rijst bijvoorbeeld de vraag: tot welke klasse behoort het, de eerste of de tweede?

Om deze verwarring te voorkomen, is een eindpuntafspraak gemaakt. Op deze manier is de eerste klasse het interval (205,245], de tweede (245,285], enzovoort.

Zodra de klassen zijn gedefinieerd, gaan we verder met het berekenen van de frequentie en hebben we de volgende tabel:

Nadat we de frequentieverdeling van de gegevens hebben verkregen, gaan we verder met het vinden van de klassemarkeringen van elk interval. In feite moeten we:

X1= (205+ 245) / 2 = 225

Xtwee= (245+ 285) / 2 = 265          

X3= (285+ 325) / 2 = 305

X4= (325+ 365) / 2 = 345

X5= (365+ 405) / 2 = 385

We kunnen dit weergeven door de volgende grafiek:

Waar is het voor?

Zoals eerder vermeld, is het klassencijfer zeer functioneel om het rekenkundig gemiddelde en de variantie te vinden van een groep gegevens die al in verschillende klassen zijn gegroepeerd..

We kunnen het rekenkundig gemiddelde definiëren als de som van de waarnemingen die zijn verkregen tussen de steekproefomvang. Fysiek gezien is de interpretatie ervan als het evenwichtspunt van een dataset.

Het identificeren van een hele dataset met een enkel nummer kan riskant zijn, dus er moet ook rekening worden gehouden met het verschil tussen dit break-evenpunt en de feitelijke gegevens. Deze waarden staan ​​bekend als afwijking van het rekenkundig gemiddelde, en hiermee proberen we te bepalen hoeveel het rekenkundig gemiddelde van de gegevens varieert..

De meest gebruikelijke manier om deze waarde te vinden, is door de variantie, het gemiddelde van de kwadraten van de afwijkingen van het rekenkundig gemiddelde.

Om het rekenkundig gemiddelde en de variantie van een set gegevens gegroepeerd in een klasse te berekenen, gebruiken we respectievelijk de volgende formules:

In deze uitdrukkingen xik  is het i-de klascijfer, fik vertegenwoordigt de overeenkomstige frequentie en k het aantal klassen waarin de gegevens zijn gegroepeerd.

Voorbeeld

Gebruikmakend van de gegevens die in het vorige voorbeeld zijn gegeven, hebben we dat we de gegevens van de frequentieverdelingstabel iets meer kunnen uitbreiden. Je krijgt het volgende:

Vervolgens, door de gegevens in de formule te vervangen, blijven we over dat het rekenkundig gemiddelde is:

De variantie en standaarddeviatie zijn:

Hieruit kunnen we concluderen dat de oorspronkelijke gegevens een rekenkundig gemiddelde hebben van 306,6 en een standaarddeviatie van 39,56..

Referenties

  1. Fernandez F. Santiago, Cordoba L. Alejandro, Cordero S. Jose M. Beschrijvende statistieken. Esic redactioneel.
  2. Johnson Richard A. Miller en Freund Probability and Statesmen for Engineers, Pearson Education.
  3. Miller I en Freund J. Waarschijnlijkheid en staatslieden voor ingenieurs. TERUGDRAAIEN.
  4. Sarabia A. Jose Maria, Pascual Marta. Basiscursus statistiek voor bedrijven
  5. Llinás S. Humberto, Rojas A. Carlos Beschrijvende statistieken en kansverdelingen, Universidad del Norte Redactioneel

Niemand heeft nog op dit artikel gereageerd.