Categorische variabele kenmerken en voorbeelden

1172
Sherman Hoover
Categorische variabele kenmerken en voorbeelden

De categorische variabele Het is degene die in statistieken wordt gebruikt om een ​​niet-numerieke of kwalitatieve eigenschap of eigenschap toe te kennen aan een object, individu, entiteit, voorwaarde of procedure. Het is mogelijk om allerlei categorische variabelen te definiëren op basis van elke behoefte. 

Voorbeelden van categorische variabelen zijn: kleur, geslacht, bloedgroep, burgerlijke staat, soort materiaal, betalingsvorm of soort bankrekening, en ze worden dagelijks veel gebruikt..

Figuur 1: Kleur is een categorische variabele. Bron: pixabay

Het bovenstaande zijn de variabelen, maar hun mogelijke waarden zijn kwalitatief, dat wil zeggen van kwaliteit of karakteristiek en niet van een numerieke meting. Bijvoorbeeld de mogelijke waarden voor de variabele seks Zij zijn: mannetje , homhelzen.

Wanneer deze variabele is opgeslagen in een computerprogramma, kan deze worden gedeclareerd als een tekstvariabele en de enige geaccepteerde waarden zijn de waarden die al genoemd zijn: Mannetje , Vrouw.

Maar dezelfde variabele seks kan worden gedeclareerd en opgeslagen als een geheel getal als een Mannetje is toegewezen 1 nu al Vrouw de waarde wordt toegekend twee. Het is om deze reden dat categorische variabelen soms worden aangeduid als opgesomd type.

Het belangrijkste kenmerk van categorische variabelen is dat het in tegenstelling tot andere variabelen, zoals continu en discreet, niet mogelijk is om ermee te rekenen. U kunt er echter wel statistieken mee maken, zoals later zal worden gezien.

Artikel index

  • 1 Voorbeelden
  • 2 Classificatie van categorische variabelen
    • 2.1 Nominale categorieën 
    • 2.2 Rangorde categorieën
    • 2.3 Binaire categorieën
  • 3 Statistieken met categorische variabelen
    • 3.1 Grafische weergave van categorische variabelen
  • 4 Opgeloste oefeningen
    • 4.1 Oefening 1
    • 4.2 Voorbeeld 2
    • 4.3 Voorbeeld 3
  • 5 referenties

Voorbeelden

Let op de volgende voorbeelden van categorische variabelen en hun mogelijke waarden:

-Bloedtype, Bereik van waarden: A, B, AB, O

-Burgerlijke staat, Categorische waarden: Single (NAAR), Getrouwd (B), Weduwnaar (C) , Gescheiden (D).

-Type materiaal, Categorieën of waarden: 1 = hout, 2 = metaal, 3 = kunststof

-Manier om te betalen, Waarden of categorieën: (1) Contant, (2) Debet, (3) Overboeking, (4) Credit

In de voorgaande voorbeelden is op een volledig willekeurige manier een nummer aan elke categorie gekoppeld. 

Men zou dan kunnen denken dat deze willekeurige numerieke associatie het gelijk maakt aan a discrete kwantitatieve variabele, maar dat is het niet, aangezien er met deze getallen geen rekenkundige bewerkingen kunnen worden uitgevoerd.

Om het idee te illustreren, in de variabele Manier om te betalen, de somoperatie heeft geen zin:

 (1) Contant geld + (2) Debet zal nooit gelijk zijn (3) Overdracht

Classificatie van categorische variabelen

De rangschikking is gebaseerd op het feit of ze al dan niet een impliciete hiërarchie hebben of dat het aantal mogelijke uitkomsten meer dan twee of twee is.

Een categorische variabele met slechts één mogelijke uitkomst is geen variabele, het is een categorische constante.

Nominale categorieën 

Als ze niet kunnen worden vertegenwoordigd door een nummer of een bestelling kunnen plaatsen. Bijvoorbeeld de variabele: Materiaaltype, theeft nominale waarden (Hout, metaal, kunststof), hebben ze geen hiërarchie of volgorde, zelfs niet als aan elk antwoord of elke categorie een willekeurig nummer is toegewezen.

Ordinal categorisch

Variabele: Academische prestatie

Nominale waarden: Hoog gemiddeld laag

Hoewel de waarden van deze variabele niet numeriek zijn, hebben ze een impliciete volgorde of hiërarchie.

Binaire categorieën

Dit zijn nominale variabelen met twee mogelijke antwoorden, bijvoorbeeld:

-Variabele: Antwoord

-Nominale waarden: Klopt, Nep

Merk op dat de variabele Antwoord het heeft geen impliciete hiërarchie en heeft slechts twee mogelijke uitkomsten, dus het is een binaire categorische variabele.

Sommige auteurs noemen dit type binaire variabele, en beschouw het niet als behorend tot de categorische variabelen die zijn beperkt tot die met meer dan drie mogelijke categorieën.

Statistieken met categorische variabelen

Statistieken kunnen worden gedaan met categorische variabelen, ondanks dat het geen numerieke of kwantitatieve variabelen zijn. Als u bijvoorbeeld de trend of de meest waarschijnlijke waarde van een categorische variabele wilt weten, neemt u Mode.

Mode het is in dit geval het meest herhaalde resultaat of de waarde van een categorische variabele. In categorische variabelen is het niet mogelijk om noch het gemiddelde, noch de mediaan te berekenen.

Het gemiddelde kan niet worden berekend omdat er niet kan worden gerekend met categorische variabelen. De mediaan ook niet, omdat de kwantitatieve of categorische variabelen geen volgorde of hiërarchie hebben, waardoor het niet mogelijk is om een ​​centrale waarde te bepalen..

Grafische weergave van categorische variabelen

Gegeven een bepaalde categorische variabele kan de frequentie of het aantal keren worden gevonden waarmee een resultaat van die variabele wordt herhaald. Als dit voor elke uitkomst wordt gedaan, kan een grafiek van de frequentie ten opzichte van elke categorie of uitkomst worden gemaakt..

Hier zijn enkele voorbeelden van hoe categorische variabelen grafisch kunnen worden weergegeven.

Opgeloste oefeningen

Oefening 1

Een bedrijf heeft gegevens van 170 werknemers bijgehouden. Een van de variabelen in deze registers is: Burgerlijke staat. Deze variabele heeft vier categorieën of mogelijke waarden:

Single (NAAR), Getrouwd (B), Weduwnaar (C) , Gescheiden (D).

Hoewel het een niet-numerieke variabele is, is het mogelijk om te weten hoeveel van de totale records zich in een bepaalde categorie bevinden en worden weergegeven in de vorm van een staafdiagram, zoals weergegeven in de volgende afbeelding:

Figuur 2. Weergave van de resultaten van een categorische variabele. Bron: zelf gemaakt

Voorbeeld 2

Een schoenenwinkel houdt zijn verkopen bij. Een van de variabelen die hun records beheren, is de schoenkleur voor elk model. De variabele: 

Color_Shoe_Model_AW3

Het is categorisch en heeft vijf mogelijke categorieën of waarden. Voor elke categorie van deze variabele wordt het aantal verkopen opgeteld en het percentage daarvan bepaald. De resultaten worden weergegeven in de grafiek van de volgende afbeelding:

Figuur 3. Categorische variabele Color _Shoe. In deze variabele is de modus Wit. Bron: zelf gemaakt.

Men kan dan zeggen dat het schoenmodel AW3 er in zit mode, degene die het vaakst wordt verkocht, is de Wit, op de voet gevolgd door Zwart

Er kan ook gezegd worden dat met een kans van 70% de volgende schoen verkocht zal worden van dit model Wit of Zwart.

Deze informatie kan handig zijn voor de winkel bij het plaatsen van nieuwe bestellingen, of het kan zelfs kortingen toepassen op de minst verkochte kleuren vanwege overtollige voorraad..

Voorbeeld 3

Voor een bepaalde populatie bloeddonoren wilt u het aantal mensen vertegenwoordigen dat tot een bepaalde bloedgroep behoort. Een grafische manier om de resultaten te visualiseren is door middel van een pictogram met op de achtergrond een tabel.

De eerste kolom vertegenwoordigt de variabele Bloedtype en de mogelijke uitkomsten of categorieën. De tweede kolom bevat de weergave in iconische of picturale vorm van het aantal mensen in elke categorie. In ons voorbeeld wordt een rode druppel als pictogram gebruikt, die elk 10 mensen voorstellen.

Figuur 4. Pictogram. Bron: zelf gemaakt

Referenties

  1. Khan Academy. Analyse van categorische gegevens. Hersteld van: khanacademy.org
  2. Universum-formules. Kwalitatieve variabele. Hersteld van: univesoformulas.com
  3. Minitab. Dat zijn categorische, discrete en continue variabelen. Hersteld van: support.minitab.com
  4. Excel-zelfstudie. Karakterisering van variabelen. Hersteld van: help.xlslat.com.
  5. Wikipedia. Statistische variabele. Opgehaald van wikipedia.com
  6. Wikipedia. Categorische variabele. Opgehaald van wikipedia.com
  7. Wikipedia. Categorische variabele. Opgehaald van wikipedia.com

Niemand heeft nog op dit artikel gereageerd.