Hur Kombinera och Merge Data Set i R

July 6

Du kanske vill kombinera data från olika källor i din analys. Generellt sett kan du använda R för att kombinera olika uppsättningar data på tre sätt:

  • Genom att lägga till kolumner: Om de två uppsättningarna av uppgifter har lika uppsättning rader och ordningen på raderna är identisk, gör sedan lägga kolumner förnuft. Dina alternativ för att göra detta är data.frame eller cbind ().
  • Genom att lägga till rader: Om båda uppsättningarna uppgifter har samma kolumner och du vill lägga till rader till botten, använd rbind ().
  • Genom att kombinera data med olika former: Sammanfogningen () funktionen kombinerar data baserat på gemensamma kolonner, liksom vanliga rader. I databaserna språket, detta brukar kallas att gå uppgifter.

Du använder merge () för att hitta skärningspunkten, liksom facket, olika datamängder. Du ser också på andra sätt att arbeta med uppslagstabeller, med hjälp av funktionerna match () och% i%.

Hur Kombinera och Merge Data Set i R

Ibland vill man kombinera data där det ISN € t så enkelt att bara lägga till kolumner eller rader. Det kan vara så att du vill kombinera data baserat på värdena redan existerande nycklar i data. Det är där merge () funktionen är användbar. Du kan använda merge () för att kombinera data endast när vissa matchande villkor är uppfyllda.

Säg till exempel, har du information om stater i ett land. Om en datauppsättning innehåller information om befolkningen och en annan innehåller information om regioner, och båda har information om tillståndet namn, kan du använda merge () för att kombinera dina resultat.