Vad är Struktur Mining?

September 25

Struktur mining är en typ av data mining, där en halvstrukturerad datakälla skannas, och delar av dess struktur upptäcks och markeras. En semistrukturerade datakälla är en som inte använder den traditionella databasstruktur av tabeller, men har en semantisk element som separerar information via taggar och markörer. Struktur mining kan användas för att gruv databaser, webbplatser och många andra former av datorinformation för att upptäcka delar av strukturen. Det hjälper användarna antingen förstå hur bitar interagerar med varandra eller hur man hittar information under vissa taggar. Denna brytning kan också användas för att förutsäga vad ett objekt är, baserat på regler skrivna av användaren.

Det finns många olika typer av data mining, och de flesta handlar om gruv ett traditionellt strukturerad källa. Detta inkluderar någon källa som använder tabeller och noder som är typiska för de flesta databaser. I strukturen gruvdrift, är bara delvis strukturerad data som används. I detta fall är uppgifterna från webbplatser eller enkla databaser som har en struktur, men inte en som överensstämmer med traditionella databasregler. Uppgifterna behöver taggar eller markörer som sätter varje objekt isär för att vara ordentligt bryts.

Genom att läsa den halvstrukturerade datamängd är strukturen gruv kunna upptäcka hur strukturen samspelar. Till exempel har varje hemsida en navigering modell, och det är denna modell som avgör hur sidorna samverkar. Genom brytning struktur, kan användaren upptäcka hur denna navigering fungerar, vilket kan bidra till att skapa en liknande navigera schema.

Struktur mining kan också användas för att hitta objekt genom att skriva regler i gruvprogrammet. Till exempel, om det finns en bok datamängd, kan användaren skriva en regel att alla böcker utan ett index ska återvända som fiktion, och de med ett index ska återvända som facklitteratur. De flesta faktaböcker saknar ett index, så denna regel kommer att förutsäga med hög noggrannhet vad uppgifterna. Detta hjälper användare när man tittar på en halvstrukturerad uppsättning som har en organisatorisk metod men inte en som passar vad användaren är ute efter.

Efter att räkna ut strukturen på den halvstrukturerade enhet, kommer användaren normalt jämför den med en annan halvstrukturerade enhet. Om användaren har ett företags webbplats, kan han eller hon gruva annat företags webbplats för navigering och länkar, och se hur hans eller hennes hemsida är liknande. Genom att jämföra den minerade informationen, kan användaren hitta sätt att öka structureâ € s effektivitet.

  • Struktur mining är en typ av data mining, där en halvstrukturerad datakälla skannas, och delar av dess struktur upptäcks och markeras.