Vad är en Coreference?

April 29

Coreference är ett fenomen i språket där flera ord eller fraser har samma referent. Detta innebär att de båda hänvisar till samma person, plats, sak, eller annan tillämplig substantiv. Denna del av språklig analys hjälper till att undersöka hur det språket används. Den är också användbar i den mer moderna studier av behandling av naturligt språk, som fungerar som en grund för olika datormodeller som analyserar tal.

Några enkla exempel på coreferences hjälper nybörjare att förstå vad som utgör den här typen av språkliga mönster. Till exempel, om någon säger "du trodde att du skulle kunna uppnå målet", de två instanser av pronomen, "du", båda hänvisar till samma person, och så det här är en form av coreference. I dessa exempel behöver de två orden inte vara samma. Till exempel, någon som säger, "John trodde att han skulle kunna uppnå målet," fortfarande genererar coreference med orden "John" och "han", som, återigen, båda avser samma person.

När det gäller tekniska lingvistik, är coreference ett exempel på en typ av anafor, vilket är ett fall där ett uttryck hänvisar till en annan. Vissa experter bryta ner i två underkategorier, där anafor är ett fall av ett uttryck som hänvisar till ett efterföljande uttryck, och en annan term, cataphora, används för ett uttryck som refererar till en föregående uttryck. Som en kategori av anafor, visar coreference också hur vissa uttryck, särskilt pronomen, kan vara ganska tvetydig, och behöver kontext för bearbetning.

När coreference används i tjänst hos naturliga språk, kan det se mycket annorlunda än när den är en del av en övergripande utredning av tal. Datorer använder mycket avancerade algoritmer för att uppnå naturliga språk i alla dess former. Extremt intrikat och komplex logik är nödvändigt att tolka tal från en teknisk synvinkel, helt enkelt eftersom så mycket av språket kretsar kring en människas förmåga att tolka ord och fraser i en annan.

För att komma runt svårigheten att replikera naturligt språk förståelse med datorer, designers och utvecklare kan använda ett koncept som kallas coreference upplösning. Denna teknik tillåter tekniken för att bli mer intelligent i termer av behandling av naturligt språk genom att arbeta med coreferences på ett särskilt sätt. Vissa experter skulle beskriva processen med coreference upplösning som en process där datorn märker alla uttryck, och sedan ordnar eller kategoriserar dem i några sammanhängande resultat.

  • Coreference är ett exempel på ett slags anaforan, vilket är ett fall där ett uttryck hänvisar till en annan.