Skapa en tvåvägs Data Table med R

February 10

En tvåvägstabell är en tabell som beskriver två kategoriska datavariabler tillsammans, och R ger dig en hel verktygslåda att arbeta med tvåvägstabeller. De innehåller antalet fall för varje kombination av kategorierna i båda variablerna. Analysen av kategoridata börjar alltid med tabeller. Men först måste du skapa tabellerna.

Hur man skapar en R datatabell från två variabler

Till exempel, vill du veta hur många bilar har tre, fyra eller fem växlar, men delas upp för bilar med automatväxellåda och bilar med manuell växellåda. Du kan göra detta igen med hjälp av tabellen funktion () med två argument, som den här:

> Med (bilar, bord (AM, redskap))
3 4 5
auto 0 8 5
manuell 15 4 0

Nivåerna av variabeln du ger som första argumentet är rad- namnen, och nivåerna av variabeln du ger som det andra argumentet är kolumnnamnen. I tabellen, får du de räknas för varje kombination. Till exempel, kan du räkna 15 bilar med manuell växellåda och tre växlar.

Hur man skapar R datatabeller från en matris

Forskare använder också tabeller för mer seriösa företag, som till att ta reda på huruvida ett visst beteende (som rökning) har en inverkan på risken att få en sjukdom (t.ex. lungcancer). Detta gör att du har fyra möjliga fall: riskbeteende och sjuka, riskbeteende och friska, ingen risk beteende och friska, eller ingen risk beteende och sjuka.

Ofta resultatet av en sådan studie består av räknas för varje kombination. Om du har räkningarna för varje fall, kan du mycket enkelt skapa tabellen själv, som den här:

> Rättegång <- matrix (c (34,11,9,32), Ncol = 2)
> Colnames (rättegången) <- c ("sjuk", "frisk")
> Rownames (rättegången) <- c ("risk", "no_risk ')
> Trial.table <- as.table (rättegången)

Med denna kod, gör du följande:

  1. Skapa en matris med antalet fall för varje kombination av sjuk / frisk och risk / ingen riskbeteende.
  2. Lägg kolumnnamn påpeka vilken kategori räkningarna är för.
  3. Konvertera den matrisen till en tabell.

Resultatet ser ut så här:

> Trial.table
sjuk frisk
risk 34 9
no_risk 11 32

En tabell som trial.table kan ses som en sammanfattning av två variabler. En variabel anger om personen är sjuk eller frisk, och den andra variabeln anger om personen visar riskbeteende.

Hur extrahera data i R

Även tabeller och matriser är två olika bestar, kan du behandla en tvåvägstabell som en matris i de flesta situationer. Detta blir praktiskt om du vill extrahera värden från tabellen. Om du vill veta hur många människor var sjuka och visade riskbeteende, du bara göra följande:

> Trial.table ["risk", "sjuka"]
[1] 34