Vad är Data Integration?

July 8

Dataintegration är en sammanslagning av flera datakällor till en enda datakälla. Denna praxis är ofta mycket tidskrävande och inblandade, såsom de olika datakällorna kan antas inkompatibla med varandra. Saker så enkelt som olika kolumnnamn på ett kalkylblad är nog för att kräva datum omformate. Denna process är vanligast i situationer där två grupper började med något samband, men placeras tillsammans efter att de har arbetat självständigt. Dataintegration har blivit ett allt viktigare ämne på grund av förekomsten av fria datakällor och online-databaser.

Den data som en del av data integration kan vara nästan vad som helst så länge som den lagras i ett datorsystem. Den faktiska innehållet av uppgifterna är sällan lika viktigt som det sätt på vilket data lagras. Merparten av tiden, är data hålls i databaser, organiserat system för information. Dessa system innehåller unika poster och fält som tillåter användare att snabbt hitta information.

Det största hindret för någon dataintegration process är själva uppgifterna. I många fall, när uppgifterna först inrättades, det fanns ingen avsikt att någonsin slå samman dataset med en annan. Det innebär att även om två datauppsättningar kan hänvisa till samma sak, de är helt oförenliga.

Nästan vad som helst kommer att göra databaser oförenliga. Något så enkelt som en skillnad i presentationen, såsom fält order eller kolumnbredd, kan vara tillräckligt för att förhindra en enkel fusion. När datan är signifikant olika, till exempel en databas som innehåller mer eller mindre information, är en sammanslagning mycket svårare.

De två situationer som kräver dataintegration mer än någon annan är i branschen och forskningsområden. I affärsvärlden, fusionerande avdelningar eller företag kräver att kombinera den tidigare separata information i en enda struktur. Denna form av integration är i allmänhet mycket svårt, om inte de ursprungliga grupperna använde liknande mjukvara och hade liknande informations mål.

När dataintegration utförs för forskningsändamål, i allmänhet går det mycket smidigare. När en forskare ger tillgång till sin information till en annan, är de två parterna i allmänhet tittar in i samma process. Detta innebär att de kommer att använda liknande metoder för att katalogisera och lagra sina data.

Förr i tiden, dataintegration var en relativt liten yta av datastudier, men detta har förändrats sedan början av 21-talet. Med gratis online-databaser blir allt mer populärt och korrekt, är företag hastigt försöker få sin information i en delbar format. Detta gör det möjligt för dem att både släppa sin information i en allmän form och att integrera privata versioner av välkända offentliga gränssnitt i sina system.

  • Dataintegration är en sammanslagning av flera datakällor till en enda datakälla.