Hur att utvärdera skillnaderna i dina data med R

August 12

För att kontrollera datamodell som du skapade med ANOVA (variansanalys), kan du använda R: s sammanställning () funktionen på modell objekt så här:

> Sammanfattning (AOVModel)
Df Sum Sq Mean Sq F-värde Pr (> F)
spraya 5 2669 533,8 34,7 <2e-16 ***
Residuals 66 1015 15,4
---
Signif. koder: 0 '***' 0.001 '**' 0.01 '*' 0,05 '.' 0.1 '' 1

R skriver du variansanalys tabell som i huvudsak berättar om de olika termerna kan förklara en betydande del av variansen i dina data. Denna tabell säger bara något om begreppet, men ingenting om skillnaderna mellan de olika sprayer. För det behöver du gräva lite djupare.

Hur kan man kontrollera uppgifterna modellbord

Med model.tables () funktionen, kan du ta en titt på resultaten för de enskilda nivåerna av faktorerna. Funktionen gör det möjligt att skapa två olika tabeller; antingen man tittar på den beräknade genomsnittliga resultatet för varje grupp, eller om du ser på skillnaden med det totala medelvärdet.

För att veta hur mycket effekt varje sprut hade, använder du följande kod:

> model.tables (AOVModel, typ = 'effekter')
Tabeller av effekter
spraya
spraya
ABCDEF
5,000 5,833 -7,417 -4,583 -6,000 7,167

Här ser du att, till exempel, spraya E ledde i genomsnitt i sex buggar färre än genomsnittet över alla områden. Å andra sidan, om områden där sprut A användes, bönderna hittade i genomsnitt fem buggar mer jämfört med det totala medelvärdet.

För att få de modellerade medel per grupp och det totala medelvärdet, bara använda argumentet värdet type = "medel" i stället för typ = "effekter".

Hur man ser på individuella skillnader i uppgifter

En bonde förmodligen inte skulle överväga att köpa sprut A, men hur sprut D? Även sprayer E och C verkar vara bättre, de också kan vara mycket dyrare. För att testa om de parvisa skillnaderna mellan sprayer är betydande, använder du Tukeys Ärlig signifikant skillnad (HSD) test. Den TukeyHSD () funktionen kan du göra det väldigt lätt, så här:

> Jämförelser <- TukeyHSD (Model)

De Jämförelser protes nu innehåller en lista där varje element är döpt efter en faktor i modellen. I exemplet har du bara ett element, som kallas spray. Detta element innehåller, för varje kombination av sprayer, följande:

  • Skillnaden mellan medelvärdena.
  • Den lägre och övre nivån av 95-procentigt konfidensintervall runt den genomsnittliga skillnaden.
  • Det p-värde som anger om denna skillnad är signifikant skild från noll. Denna p-värdet justeras med hjälp av metoden för Tukey (därav, kolumnnamnet p adj).

Du kan extrahera all denna information med hjälp av de klassiska metoderna för utvinning. Till exempel får du information om skillnaden mellan D och C så här:

> Jämförelser $ spraya ['D-C',]
diff LWR UPR p adj
2.8333333 -1,8660752 7,5327418 0,4920707

Denna skillnad ser inte imponerande, om du frågar Tukey.

Hur tomt skillnaderna

Den TukeyHSD objektet har en annan trevlig funktion: Det kan ritas. Bry dig inte ute efter en hjälpsida för tomten funktion - allt du hittar är en mening: "Det finns en tomt metod". Men det definitivt fungerar! Prova det så här:

> Plot (Jämförelser, las = 1)

Du ser produktionen av denna enkla linjen. Varje linje representerar den genomsnittliga skillnaden mellan de båda grupperna med enligt konfidensintervall. Närhelst konfidensintervallet inte inkluderar noll (den vertikala linjen), är skillnaden mellan de båda grupperna signifikant.

Du kan använda en del av de grafiska parametrar för att göra tomten mer lättläst. Närmare bestämt är det las parametern användbart här. Genom att ställa den till 1, du ser till alla axeletiketter skrivs vågrätt så att du faktiskt kan läsa dem.

Hur att utvärdera skillnaderna i dina data med R