Vad är Audio Mining?

December 3

Ljudgruv används vanligen i taligenkänning programvara och musikanalys. Denna teknik ger användaren möjlighet att söka igenom tal eller musik ljud som har analyserats för specifika egenskaper. Vid användning i taligenkänningsteknik, identifierar ljudgruv talade ord i ljud och sätter dem i en sökbar fil. Den här funktionen kan vara användbar för studenter eller personer i näringslivet som deltar många möten, eftersom det tillåter användaren att lättare bläddra aktuell information från tal presentationer. Denna typ av analys kan också användas i musiken för att bestämma egenskaper som slag per minut (BPM), tonart, och musikalisk struktur, information som används för att klassificera musik.

I taligenkänning, där tekniken används oftast, är ljudgruv användas för att skapa en akustisk modell. En akustisk modellprogram taligenkänning programvara att känna igen tal mönster som ord. Denna teknik är utvecklad av ljud brytning en inspelning av en talad fras, som jämförs till text som matchar det talade frasen. Datorn använder informationen för att känna igen ord när användaren gör liknande ljud till de i den akustiska modellen. En akustisk modell används i kombination med en fil som talar om för taligenkänning programmet vilket språk att tolka och vilka mönster av ord sannolikt att talas i vissa meningar och situationer.

Musiker och musiklyssnare kan både dra nytta av ljud brytning i musiken. Ibland musikprogram som kategoriserar musik efter genre använder ljudgruv att organisera musiken. Process identifierar och grupper musikfiler med ljud likheter som ofta förekommer i musikaliska genrer. Även denna teknik kan göra att organisera musik och hitta ny musik lättare, kan man göra misstag som klassificerar låtar som har liknande uppmätta egenskaper men olika totala ljud. Ljud analysera programvara kan vara till nytta för musiker, speciellt kompositörer, eftersom det tillåter kompositören att hoppa till specifika delar av låten strukturen, inklusive musikaliska viktiga förändringar och ord inom texterna.

Den taligenkänning programvarutillverkaren DRAGON säljer ett program som heter AudioMining som transkriberar ljudfiler och markerar filerna så att de kan sökas för text. Draken är en tillverkare av datorlingvistik program, den tekniska termen för området programvara avsedd att tolka tal. Ljud gruv-, när den används som två ord, är en allmän term som hänvisar till att analysera en ljudfil för en bestämd uppsättning ljudegenskaper. Andra tillverkare av audio mining programvara inkluderar Nuance och Nexidia.