Hur Model Linear Data Förbindelserna med R

January 3

En variansanalys för dina data även kan skrivas som en linjär modell i R, där du använder en faktor som prediktor variabel för att modellera en responsvariabel.

Naturligtvis prediktorvariabler också kan vara kontinuerliga variabler. Till exempel har vikten på en bil naturligtvis ett inflytande på körsträcka. Men det skulle vara trevligt att ha en uppfattning om omfattningen av denna påverkan. I huvudsak, du vill hitta ekvationen som representerar trendlinjen. Du hittar den information du behöver för att kontrollera detta i datamängds mtcars.

Hur Model Linear Data Förbindelserna med R

Hur man bygger en linjär modell

Den lm () funktionen kan du ange något från de mest enkla linjära modellen till komplexa interaktionsmodeller.

För att modellera den körsträcka som funktion av vikten på en bil använder du lm () funktion, så här:

> Modell <- lm (mpg ~ vikt, Data = mtcars)

Du levererar två argument:

  • En formel som beskriver modellen: Här, du modell variabeln mpg som en funktion av variabeln vikt.
  • Ett dataramen som innehåller variablerna i formeln: Här använder du dataramen mtcars.

Du kan ange många komplexa modeller med formeln gränssnittet när du känner dig runt.

Den resulterande objektet är en lista med en mycket komplex struktur, men i de flesta fall du donâ € t behov av att oroa sig. Modellobjektet innehåller en hel del information att? € s behövs för beräkningarna av diagnostik och nya förutsägelser.

Hur att extrahera information från modellen

Istället för att dyka in i modellen själva objektet och hitta den information någonstans i objektlistan, kan du använda vissa funktioner som hjälper dig att få nödvändig information från modellen. Till exempel kan du extrahera en namngiven vektor med koefficienterna från den modell som använder coef () funktionen, som den här:

> Coef.Model <- coef (Model)
> Coef.Model
(Intercept) vikt
37.285126 -5,344472

Dessa koefficienter representerar interceptet och lutningen på trendlinjen. Du kan använda detta för att rita trendlinjen på en spridningsdiagram av data. Du gör detta i två steg:

  1. Du plotta spridningsdiagram med data.

    Du använder tomten () funktion för detta.
  2. Du använder abline () för att rita trendlinjen bygger på koefficienter.

Följande kod ger dig tomten:

> Plot (mpg ~ vikt, data = mtcars)
> Abline (a = coef.Model [1], b = coef.Model [2])

Den abline () argument a representerar skärnings, och b representerar lutningen på trendlinjen som du vill rita. Du rita en lodrät linje genom att ställa argumentet v till skärningen med x -axeln istället. Horisontella linjer plottas genom att ställa argumentet v till skärningen med y -axeln.

Nedan följer en översikt över funktioner för att extrahera information från modellen själva objektet. Dessa funktioner arbetar med olika modellobjekt, inklusive de byggt av AOV () och lm ().

Många paket författare ger också samma funktioner för modellerna byggda av funktionerna i deras paket. Så kan du alltid försöka använda dessa utvinning funktioner i kombination med andra modellen fungerar också.

Funktion Vad den gör
coef () Returnerar en vektor med koefficienter från modellen
confint () Returnerar en matris med den övre och undre gränsen för konfidensintervallet för varje koefficient av modellen
monterad () Returnerar en vektor med de inbyggda värden för varje observation
residualer () Returnerar en vektor med förbättringarna för varje observation
vcov () Returnerar variansen-kovariansmatrisen för koefficienten