Tukey's test van waaruit het bestaat, voorbeeldgeval, oefening opgelost

4127
Sherman Hoover

De tukey-test is een methode die tot doel heeft de individuele gemiddelden te vergelijken op basis van een variantieanalyse van verschillende monsters die aan verschillende behandelingen zijn onderworpen.

De test, gepresenteerd in 1949 door John.W. Tukey, stelt ons in staat om te onderscheiden of de verkregen resultaten significant verschillen of niet. Het is ook bekend als de Tukey's echt significante verschil-testTukey's HSD-test voor zijn acroniem in het Engels).

Figuur 1. Met de Tukey-test kunnen we onderscheiden of de verschillen in de resultaten tussen drie of meer verschillende behandelingen toegepast op drie of meer groepen met dezelfde kenmerken significant en eerlijk verschillende gemiddelde waarden hebben..

Bij experimenten waarbij drie of meer verschillende behandelingen toegepast op hetzelfde aantal monsters worden vergeleken, is het nodig om te onderscheiden of de resultaten significant verschillen of niet..

Van een experiment wordt gezegd dat het evenwichtig is als de grootte van alle statistische steekproeven bij elke behandeling gelijk is. Als de grootte van de monsters voor elke behandeling anders is, is dat een onevenwichtig experiment.

Soms is het met een variantieanalyse (ANOVA) niet voldoende om te weten of ze bij het vergelijken van verschillende behandelingen (of experimenten) toegepast op verschillende steekproeven voldoen aan de nulhypothese (Ho: 'alle behandelingen zijn gelijk') of voldoen aan het alternatief hypothese (Ha: "tenminste een van de behandelingen is anders").

De test van Tukey is niet uniek, er zijn veel meer tests om steekproefgemiddelden te vergelijken, maar dit is een van de bekendste en meest toegepaste.

Artikel index

  • 1 Comparator en Tukey-tabel
    • 1.1 Onevenwichtige experimenten
  • 2 Voorbeeldgeval
  • 3 Oefening opgelost
  • 4 referenties

Tukey-vergelijker en tafel

Bij de toepassing van deze test wordt een waarde berekend w genaamd de Tukey-vergelijker waarvan de definitie als volgt is:

w = q √ (MSE / r)

Waar de factor wat wordt verkregen uit een tabel (Tukey's Table), bestaande uit rijen met waarden wat voor een verschillend aantal behandelingen of experimenten. Kolommen geven de factorwaarde aan wat voor verschillende vrijheidsgraden. Gewoonlijk hebben de beschikbare tabellen een relatieve significantie van 0,05 en 0,01.

In deze formule verschijnt binnen de vierkantswortel de factor MSE (Mean Square of Error) gedeeld door r, die het aantal herhalingen aangeeft. De MSE is een getal dat normaal wordt verkregen uit een variantiesanalyse (ANOVA).

Wanneer het verschil tussen twee gemiddelde waarden groter is dan de waarde w (Tukey-comparator), dan wordt geconcludeerd dat het verschillende gemiddelden zijn, maar als het verschil kleiner is dan het Tukey-getal, dan zijn het twee monsters met een statistisch identieke gemiddelde waarde.

Het nummer w is ook bekend als het HSD-nummer (Honestly Significant Difference).

Dit enkele vergelijkende aantal kan worden toegepast als het aantal monsters dat voor de test van elke behandeling wordt gebruikt, in elk van hen hetzelfde is..

Onevenwichtige experimenten

Wanneer om de een of andere reden de grootte van de monsters bij elke te vergelijken behandeling anders is, verschilt de hierboven beschreven procedure enigszins en staat bekend als Tukey-Kramer-test.

Nu krijg je een nummer w comparator voor elk paar behandelingen ik, j

w (i, j) = q √ (½ MSE / (ri + rj))

In deze formule wordt de factor q verkregen uit de tabel van Tukey. Deze factor q is afhankelijk van het aantal behandelingen en de vrijheidsgraden van de fout. rik is het aantal herhalingen in behandeling i, terwijl rj is het aantal herhalingen in behandeling j.

Voorbeeldgeval

Een konijnenfokker wil een betrouwbare statistische studie doen die hem vertelt welke van de vier merken vetmestvoeder voor konijnen het meest effectief is. Voor het onderzoek vormt het vier groepen met zes konijnen van anderhalve maand oud die tot dat moment dezelfde voedingsomstandigheden hadden..

De redenen waren dat in de groepen A1 en A4 sterfgevallen vielen door oorzaken die niet aan voedsel te wijten waren, aangezien een van de konijnen werd gebeten door een insect en in het andere geval waarschijnlijk de dood de oorzaak was van een aangeboren afwijking. Zodat de groepen uit balans zijn en dan is het noodzakelijk om de Tukey-Kramer-test toe te passen.

Oefening opgelost

Om de berekeningen niet te lang te verlengen, wordt een uitgebalanceerde experimentcase als een opgeloste oefening beschouwd. Het volgende wordt als data beschouwd:

In dit geval zijn er vier groepen die overeenkomen met vier verschillende behandelingen. We zien echter dat alle groepen evenveel gegevens hebben, dus het is dan een evenwichtig geval.

Om de ANOVA-analyse uit te voeren, de tool die is opgenomen in de spreadsheet van Libreoffice. Andere spreadsheets zoals Excel hebben deze tool voor data-analyse ingebouwd. Hieronder vindt u een samenvattende tabel die is ontstaan ​​na het uitvoeren van de variantieanalyse (ANOVA):

Uit de variantieanalyse hebben we ook de P-waarde, die voor het voorbeeld 2,24E-6 ruim onder het 0,05 significantieniveau ligt, wat direct leidt tot het verwerpen van de nulhypothese: alle behandelingen zijn gelijk. 

Dat wil zeggen, van de behandelingen hebben sommige verschillende gemiddelde waarden, maar het is noodzakelijk om te weten welke significant en eerlijk verschillend (HSD) zijn vanuit statistisch oogpunt met behulp van de Tukey-test..

Om het nummer w te vinden of omdat het HSD-nummer ook bekend is, moeten we het gemiddelde kwadraat van de fout MSE vinden. Uit de ANOVA-analyse blijkt dat de som van de kwadraten binnen de groepen SS = 0,2 is; en het aantal vrijheidsgraden binnen de groepen is df = 16 met deze gegevens kunnen we MSE vinden:

MSE = SS / df = 0,2 / 16 = 0,0125

Het is ook vereist om de factor te vinden wat van Tukey, met behulp van de tafel. Kolom 4, die overeenkomt met de 4 groepen of behandelingen die moeten worden vergeleken, en rij 16 worden doorzocht, aangezien de ANOVA-analyse 16 vrijheidsgraden binnen de groepen opleverde. Dit leidt tot een waarde van q gelijk aan: q = 4,33 komt overeen met 0,05 significantie of 95% betrouwbaarheid. Ten slotte wordt de waarde voor het "eerlijk significante verschil" gevonden:

w = HSD = q √ (MSE / r) = 4,33 √ (0,0125 / 5) = 0,2165

Om te weten welke de eerlijk verschillende groepen of behandelingen zijn, moet u de gemiddelde waarden van elke behandeling kennen:

Het is ook noodzakelijk om de verschillen te kennen tussen de gemiddelde waarden van paren behandelingen, die in de volgende tabel worden weergegeven:

Geconcludeerd wordt dat de beste behandelingen, in termen van het maximaliseren van het resultaat, T1 of T3 zijn, die statistisch gezien onverschillig zijn. Om te kiezen tussen T1 en T3, zou men moeten zoeken naar andere factoren buiten de hier gepresenteerde analyse. Bijvoorbeeld prijs, beschikbaarheid, etc..

Referenties

  1. Cochran William en Cox Gertrude. 1974. Experimentele ontwerpen. Dorsen. Mexico. Derde herdruk. 661p.
  2. Snedecor, G.W. en Cochran, W.G. 1980. Statistische methoden. Zevende Ed. Iowa, The Iowa State University Press. 507p.
  3. Staal, R.G.D. en Torrie, J.H. 1980. Principes en procedures van de statistiek: een biometrische benadering (2e editie). McGraw-Hill, New York. 629p.
  4. Tukey, J. W. 1949. Individuele gemiddelden vergelijken in de variantieanalyse. Biometrie, 5: 99-114.
  5. Wikipedia. Tukey's test. Hersteld van: en.wikipedia.com

Niemand heeft nog op dit artikel gereageerd.