Vad är skillnaden mellan Data Mining och Data Warehousing?

June 23

Gruv termer och datawarehousing ofta förvirrad av både affärs- och teknisk personal. Hela området datahantering har upplevt en enorm tillväxt med genomförandet av datainsamling program och minskade kostnader för datorminne. Det primära syftet bakom båda dessa funktioner är att ge de verktyg och metoder för att utforska mönster och mening i stor mängd data.

Den främsta skillnaden mellan data mining och datalagring är systemkonstruktioner, metoder som använts, och syftet. Data mining är användningen av mönsterigenkänning logik identitetsutvecklingen inom ett prov datamängd och extrapolera denna information mot större uppgifter poolen. Datalagring är processen att utvinna och lagra data för att möjliggöra enklare rapportering.

Data mining är en allmän term som används för att beskriva en rad affärsprocesser som härrör mönster från data. Normalt är en statistisk paket analysprogram som används för att identifiera specifika mönster, baserat på data som och förfrågningar som genereras av slutanvändaren. En typisk användning av data mining är att skapa riktade marknadsföringsprogram, identifiera finansiella bedrägerier, och att flagga ovanliga mönster i beteende som en del av en säkerhetsgranskning.

Ett utmärkt exempel på data mining är den process som används av telefonföretag att marknadsföra produkter till befintliga kunder. Telefonbolaget använder data mining programvara för att komma åt sin databas med kundinformation. En fråga är skriven för att identifiera kunder som prenumererar på den grundläggande telefon paketet och Internettjänsten under en viss tidsperiod. När denna datamängd väljs en annan fråga skriven för att avgöra hur många av dessa kunder utnyttjade gratis extra telefonfunktioner under en rättegång befordran. Resultaten av denna data mining övningen avslöjar beteendemönster som kan köra bil eller hjälpa förfina en marknadsplan för att öka användningen av ytterligare telefonitjänster.

Det är viktigt att notera att det primära syftet med data mining är att upptäcka mönster i data. De specifikationer som används för att definiera provuppsättning har en enorm inverkan på relevansen av produktionen och noggrannheten i analysen. Återvänder till exemplet ovan, om datamängden är begränsad till kunder inom ett visst geografiskt område, kommer resultaten och mönster skiljer sig från en bredare uppsättning data. Även om både data mining och datalagring arbete med stora mängder information, de processer som används är helt olika.

Ett datalager är en programvara som används för att lagra stora mängder data och köra särskilt utformade frågor och rapporter. Business Intelligence är ett växande ämnesområde som fokuserar på datalagring och tillhörande funktioner. Dessa verktyg är utformade för att extrahera data och lagra den i en metod som syftar till att ge ökad systemprestanda. Mycket av terminologin i data mining och datalagring är samma, vilket leder till mer förvirring.

  • Data mining är användningen av mönsterigenkänning logik identitetsutvecklingen inom ett prov datamängd och extrapolera denna information mot större uppgifter poolen, medan datalagring är processen att utvinna och lagra data för att möjliggöra enklare rapportering.