Rumslig Databaser i ett Big Data Miljö

July 14

Rumsliga databaser kan vara ett viktigt verktyg i din stora dataprojektet. Spatial data själv är standardiserad genom insatser av Open Geospatial Consortium (OGC), som fastställer OpenGIS (Geographic Information System) och ett antal andra standarder för rumsliga data.

Oavsett om du vet det eller inte, kan du interagera med geografiska data varje dag. Om du använder en smartphone eller Global Positioning System (GPS) för vägbeskrivning till en viss plats, eller om du frågar en sökmotor för placeringen av skaldjur restauranger i närheten en fysisk adress eller landmärke, du använder program som förlitar sig på geografiska data.

Detta är viktigt eftersom rumsliga databaser är implementeringar av OGC standarder, och ditt företag kan ha särskilda behov tillgodoses av normerna. En rumslig databas blir viktigt när organisationer börjar utnyttja flera olika dimensioner av data. Till exempel kan en meteorolog gör forskning vill lagra och utvärdera data om en orkan, inklusive temperatur, vindhastighet och luftfuktighet, och modellera dessa resultat i tre dimensioner.

I sin enklaste form, rumsliga databaser lagrar uppgifter om 2-dimensionella, 2,5-dimensionella och 3-dimensionella objekt. Du är förmodligen bekant med 2D och 3D-objekt. En 2D-objekt har längd och bredd. En 3D-objekt lägger till djup i längd och bredd. En sida ur en bok är ett 2D-objekt, medan en hel bok är ett 3D-objekt.

Hur är 2.5D? 2.5D objekt är en speciell typ av geografiska data. De är 2D-objekt med höjd som den extra "halv" dimension. De flesta 2.5D rumsliga databaser innehåller kartläggning information och är ofta kallad Geografiska Informationssystem (GISS).

Atom delar av rumsliga databaser är linjer, punkter och polygoner. De kan kombineras på något sätt för att representera alla föremål begränsas av två, 2,5, eller 3 dimensioner. På grund av den särskilda karaktären hos rumsliga dataobjekt, designers skapat indexeringsmekanismer (spatiala index) för att stödja ad hoc-frågor och visuella representationer av innehållet i databasen.

Till exempel skulle en rumslig index svara på frågan "Vad är avståndet mellan en punkt och en annan punkt?" Eller "Är en specifik linje skär med en viss uppsättning polygoner?" Om detta verkar vara ett stort problem, det är för att det är . Rumsliga data kan mycket väl representera den största stora uppgifter utmaningen av alla.

PostGIS är ett open source-projekt som upprätthålls av Refractions Forskning och är licensierat under GNU General Public License (GPL). PostGIS levereras också som en del av OpenGeo Suite Community Edition och erbjuds och stöds av OpenGeo enligt en företagslicens.

PostGIS är en specialiserad, skiktad genomförande körs på arbetshäst RDBMS PostgreSQL. Detta tillvägagångssätt erbjuder det bästa av två världar. Du får alla fördelar med en SQL RDBMS (såsom transaktionsintegritet och ACID) och stöd för de specialiserade verksamheter som behövs för rumsliga tillämpningar (omprojiceringen, geodetiska support, geometri konvertering, och så vidare).

Även själva databasen är mycket viktigt, du kommer också att kräva andra bitar av teknik för att hantera rumsliga applikationskrav. Lyckligtvis är PostGIS del av ett ekosystem av komponenter konstruerade för att arbeta tillsammans för att tillgodose dessa behov. Förutom PostGIS, den OpenGEO Suite består av följande:

  • GeoServer: Genomfört i Java, kan det GeoServer publicera geografisk information från flera av de främsta källorna till rumsliga data på webben. Det kan integreras med Google Earth och har även en utmärkt webbaserat administrativt front.
  • OpenLayers: Ett bibliotek för JavaScript som är användbar för att visa kartor och andra representationer av geografiska data i en webbläsare. Det kan manipulera bilder från de flesta av de kartläggningskällor på webben, inklusive Bing Maps, Google Maps, Maps Yahoo!, OpenStreetMap, och så vidare.
  • GeoExt: Designad för att göra kartan information från OpenLayers lättillgängliga till webbapplikationsutvecklare. GeoExt widgetar som kan användas för att skapa redigering, visning, styling, och andra interaktiva webbupplevelser.
  • GeowebCache: När du har data i en server och kan visa den i en webbläsare, måste du hitta ett sätt att göra det snabbt. GeowebCache är acceleratorn. Det cachar bitar av bilddata (kallade plattor) och gör dem tillgängliga för snabb leverans till visningsenheten.

Medan många av de användningsområden för rumsliga data involverar kartor och platser, har rumsliga data många andra samtida och framtida tillämpningar, inklusive

  • Exakt 3D modellering av den mänskliga kroppen, byggnader, atmosfären, och så vidare
  • Insamling och analys av data från sensornätverk
  • Integration med historiska data för att undersöka 3D rymd / objekt över tiden