Vad är datorseende algoritmer?

November 19

Datorseende algoritmer är matematiska modeller som försöker hjälpa en dator att tolka en bild. Människor tolkar bilder i många komplexa sätt, där det faktiska förmåga datorer för att tolka bilder är ytterst begränsad, även med den nyaste tekniken. Datorseende algoritmer bidrar också till att göra framsteg på de sätt som datorerna kan få specifika typer av data från en bild.

Utmaningen av ingenjörer som använder datorseende algoritmer är att visionen bygger på en serie av avdrag i samband med okända delar av bilden. Forskarna kallar detta ett "omvänt problem", och säger att endast komplexa fysikbaserade sannolikhetsmodeller kan hjälpa teknologi för att tolka en bild på djupgående sätt. Forskarna arbetar på det allmänna problemet med datorseende från olika vinklar, inklusive tredimensionell modellering, erkännande av delar av en bild, och prediktiv bildmodellering.

Ett brett utbud av datorseende algoritmer arbetar på olika sätt. Några av dem arbetar för att identifiera specifika delar av ett fotografi eller en bild. En del av denna typ av teknik leder till nya ansiktsigenkänning funktioner på kameror eller säkerhetsutrustning.

Andra typer av datorseende algoritmer försöka fånga specifika typer av data från en bild. Många av dessa är nu används i detaljhandeln området, där identifiera mönster från dokument kan vara användbart, till exempel i analysen av tryckta streckkoder och liknande kännetecken. Ytterligare andra typer av datorseende algoritmer används i tredimensionell återgivning och simuleringar.

Det finns också en helt annan klass av datorseende algoritmer relaterade till fordonsindustrin. Några av dessa är att tillhandahålla verktyg för vad auto experter refererar till som "augmented reality". I de nyaste fordonsteknik kan datorer hjälpa människor att tolka vägen framåt och undvika vägar faror eller ens överhängande kollisioner. Dessa tekniker också ofta förlitar sig på datorseende algoritmer som tolkar visuella data runt fordonet, levererar de tolkade resultaten för det mänskliga förare.

De som studerar algoritmer för datorseende kan ofta lära från några av de olika typer av algoritmer som används för olika bilduppgifter. En av dessa är användningen av algoritmer i "morphing", där en bild förvandlas till en annan. En annan typ av algoritm är multi-view återuppbyggnad. Dessa olika typer av algoritmer utföra specifika uppgifter i vad som kallas bildbehandling, där människor program teknik för att fånga specifika data och hantera det i exakta sätt, eller ens för fysiska reproduktionen via 3D utskriftsprogram.

  • Datorseende teknik kan innebära något annat än en videokamera ansluten till en dator som innehåller tolkande programvara.
  • Datorseende algoritmer är matematiska modeller som försöker hjälpa en dator att tolka en bild.