Hur man beräknar Data Proportioner och Hitta Center i R

March 30

Efter att du har datatabellen med räkningarna, kan du använda R för att enkelt beräkna hur stor andel av varje räkning till den totala helt enkelt genom att dividera bordet av de totala räknas. För att beräkna hur stor andel av manuella och automatiska växellådor i datamängden bilar, kan du använda följande kod:

> Amtable / summa (amtable)
automatisk manuell
0,40625 0,59375

Ändå ger R också prop.table () för att göra detsamma. Du kan få exakt samma resultat som föregående kodrad genom att göra följande:

> Prop.table (amtable)

Du kanske undrar varför du skulle använda en extra funktion för något som är så enkelt som att dela med summan. Den prop.table () funktionen kan också beräkna marginal proportioner.

I statistiken är det läge för en kategorisk variabel det värde som förekommer oftast. Det är inte precis i mitten av dina data, men om det inte finns någon ordning i dina data - om man tittar på en nominell variabel - kan man inte riktigt prata om ett centrum heller.

Även om det inte är en specifik funktion för att beräkna läget, kan du få det genom att kombinera några knep:

  1. För att få de räknas för varje värde, använd tabellen ().
  2. För att hitta platsen för den maximala antalet räkningar, använd max ().
  3. För att hitta läget för din variabel, välj namnet motsvarar platsen i steg 2 i tabellen i steg 1.

Så, för att hitta läget för variabeln am i datamängden bilar, kan du använda följande kod:

> Id <- amtable == max (amtable)
> namn (amtable) [id]
[1] "manuell"

Variabeln id innehåller en logisk vektor som har värdet SANT för varje värde i tabellen amtable som är lika med det maximala i den tabellen. Du väljer namnet från värdena i amtable använder denna logiska vektor som index.

Du kan även använda which.max () funktion att hitta platsen för den maximala i en vektor. Denna funktion har en viktig nackdel, men: Om du har flera trösklar, which.max () returnerar positionen för endast det första maximum. Om du är intresserad av alla trösklar, bör du använda konstruktionen i föregående exempel.