Utforska Big Data Stack

October 25

För att förstå stora uppgifter, hjälper det att se hur det står sig - det vill säga att lägga ut komponenterna i arkitekturen. En stor datahantering arkitektur måste innehålla en mängd olika tjänster som möjliggör för företag att använda sig av otaliga datakällor på ett snabbt och effektivt sätt.

Utforska Big Data Stack

Här är en närmare titt på vad som finns i bilden och förhållandet mellan komponenterna:

  • Gränssnitt och feeds: På ömse sidor om diagrammet är indikationer på gränssnitt och matar in i och ut ur både internt förvaltade och dataflöden från externa källor. För att förstå hur stor uppgifter fungerar i den verkliga världen, börja med att förstå denna nödvändighet.

    Vad gör big data stor är att det bygger på att plocka upp massor av data från massor av källor. Därför kommer öppna applikationsprogrammeringsgränssnitt (API) vara kärnan till alla stora dataarkitektur.

    Dessutom kom ihåg att gränssnitten finns på alla nivåer och mellan varje lager av stapeln. Utan integrationstjänster, kan stora uppgifter inte hända.

  • Redundant fysisk infrastruktur: Den stödjande fysisk infrastruktur är grundläggande för driften och skalbarhet av ett stort dataarkitektur. Utan tillgång till robusta fysiska infrastruktur, big data skulle förmodligen inte ha dykt upp som en sådan viktig trend.

    För att stödja en oväntad eller oförutsägbar mängd data, har en fysisk infrastruktur för stora uppgifter att vara annorlunda än för traditionella uppgifter. Den fysiska infrastrukturen är baserad på en distribuerad beräkningsmodellen. Detta innebär att data kan vara fysiskt lagras på många olika platser och kan kopplas samman genom nätverk, användning av ett distribuerat filsystem, och olika stora uppgifter analytiska verktyg och applikationer.
  • Säkerhetsinfrastruktur: Ju viktigare stora dataanalys blir till företag, desto viktigare blir det att säkerställa att uppgifterna. Till exempel, om du är ett hälsovårdsföretag, kommer du antagligen att vilja använda stora dataapplikationer för att fastställa förändringar i demografi eller förändringar i patienternas behov.

    Denna information om dina väljare måste skyddas både att möta villkoren och för att skydda patienternas integritet. Du kommer att behöva ta hänsyn till vem som får se de data och under vilka omständigheter de får göra det. Du måste kunna kontrollera identiteten hos användare samt skydda identiteten på patienterna.
  • Operativa datakällor: När du tänker på stora uppgifter, förstår att du måste införliva alla de datakällor som ger dig en fullständig bild av din verksamhet och se hur data påverkar hur du driver ditt företag.

    Traditionellt bestod en operativ datakälla av mycket strukturerad data som hanteras av bransch i en relationsdatabas. Men eftersom världen förändras, är det viktigt att förstå att driftdata har nu omfatta en bredare uppsättning av datakällor.