Hur att analysera data Avvikelser i modeller med R

April 28

En variansanalys (ANOVA) är en mycket vanlig teknik som används med R för att jämföra medel mellan olika grupper av data. För att illustrera detta, ta en titt på den dataset InsectSpray:

> str (InsectSprays)
'Data.frame': 72 obs. 2 variabler:
$ Räkna: num 10 7 20 14 14 12 10 23 17 20 ...
$ Spray: Faktor w / 6 nivåer "A", "B", "C", "D", ..: 1 1 1 1 1 1 1 1 1 1 ...

Detta dataset innehåller resultaten från en jordbruksexperiment. Sex insekticider testades på 12 områden vardera, och forskarna räknade antalet irriterande buggar som stod kvar på varje fält. Nu bönderna behöver veta om insekts gör någon skillnad, och i så fall vilken en de bästa användning. Du svara på denna fråga genom att använda AOV () för att utföra en ANOVA.

Hur man bygger modellen

För detta enkla exempel bygga modellen är en bit av kakan. Du vill i huvudsak att model medlen för variabeln räknas som en funktion av variabeln spray. Du översätter det till R så här:

> AOVModel <- AOV (räkna ~ sprut, data = InsectSprays)

Du passerar två argument till AOV () funktionen i denna kodrad:

  • Formeln räkna ~ sprej, som lyder som "räknas som en funktion av sprej"
  • Argumentet uppgifter, där du anger dataramen där variablerna i formeln kan hittas

Varje modellering returnerar ett modellobjekt med en hel del information om den anpassade modell. Sätt alltid denna modell objekt i en variabel. Detta gör att du inte behöver montera modellen när du behöver utföra extra beräkningar.

Hur man ser på modellobjekt

Som med alla objekt kan du titta på en modellobjekt genom att bara skriva sitt namn i konsolen. Om du gör det för objektet Model som du har skapat, ser du följande utdata:

> AOVModel
Ring:
AOV (formel = count ~ sprut, data = InsectSprays)
Villkor:
spraya Residuals
Summan av Squares 2668.833 1015.167
Deg. Frihet 5 66
Rest standardfel: 3.921902
Beräknade effekter kan vara obalanserad

Detta betyder inte berätta så mycket, förutom kommandot (eller samtalet) som du använde för att bygga modellen och en del grundläggande information om montering resultatet.

I produktionen, även du läste de beräknade effekterna kan vara obalanserad. Detta är inte en varning - det är ett budskap som är byggd av författaren av AOV funktion (). Detta kan dyka upp i två situationer:

  • Du har inte samma antal fall i varje grupp.
  • Du ställde inte in ortogonala kontraster.

I det här fallet är det det andra skälet.