Toshiba Corporation har utviklet en AI med 3D-gjenkjenning som er i stand til å måle avstand med nøyaktigheten til et stereokamera, ved å bruke bildet tatt med et kommersielt kamera og analysere uskarpheten forårsaket av kameralinsen ved hjelp av dyp læring. Denne teknologien vil eliminere bruken av stereokameraer som til slutt reduserer kostnadene og plassen. Toshiba vil presentere denne prestasjonen på den internasjonale konferansen om datasyn (ICCV2019) som skal holdes i Sør-Korea 30. oktober 2019, fra kl. 10.00.
Bildesensing blir viktigere, og applikasjoner som roboter som beveger objekter, autonome ubemannede kjøretøyer, fjernstyrte droner som inspiserer infrastruktur osv., Krever mer enn bare bilder av motivene, de trenger en liten enhet for å analysere 3D-data for å inkludere form og avstand. Derfor er forskningen økt for å utvikle en målingsteknologi med monokulære kameraer (de er enkle å miniatyrisere) ved å bruke dyp læring for bedre læring av form, bakgrunn og andre landskapsdata til det avbildede objektet.
Denne metoden har en ulempe; avstandens nøyaktighet estimeres ved hjelp av et monokulært kamera, avhengig av innlærte naturdata som forårsaker et nøyaktighetsfall på grunn av bildene tatt i forskjellige landskap. For å overvinne dette har Toshiba utviklet fargefiltrert blenderfotografering der to fargefilter er festet til linsen, og fargen og størrelsen på den resulterende uskarpheten blir analysert i henhold til avstanden fra motivet. Selv om dette løser problemet med dataavhengighet, koster det tid og penger å endre eksisterende linser.
Toshiba har overvunnet dette problemet ved å utvikle AI med 3D-gjenkjenningsteknologi som bruker dyp læring for å analysere hvordan bildet blir uskarpt i henhold til dets posisjon på linsen, for å oppnå avstandsmåling med samme høye presisjon som et stereokamerasystem, med et vanlig monokulært kamera, men uten behov for naturdata. Inntil nå ble det ansett som teoretisk umulig å måle avstanden basert på uskarphetsformen, som er den samme for objekter med både avstand og langt når de er like langt fra fokuspunktet. Men de analytiske resultatene har vist en betydelig forskjell mellom uskarphetsformene nær og fjerne objekter, selv om de er like langt fra fokuspunktet. Med det analyserte Toshiba uskarpe data fra fangede bilder ved hjelp av en dyp læringsmodul trent med den dype nevrale nettverksmodellen.
Når lyset passerer gjennom linsen, er det kjent at formen på uskarpheten endres avhengig av lysets bølgelengde og dets posisjon i linsen. I det utviklede nettverket behandles posisjon og farge separat for å oppfatte endringer i uskarphet på riktig måte, og deretter, etter å ha passert gjennom en vektet oppmerksomhetsmekanisme, for å kontrollere hvor på lysstyrkegradienten som skal fokuseres for å kunne måle avstanden riktig. Gjennom læring oppdateres nettverket for å redusere en feil mellom den målte avstanden og den faktiske avstanden. Ved å bruke denne AI-modulen har Toshiba bekreftet at et enkelt bilde tatt med et kommersielt tilgjengelig kamera realiserer den samme nøyaktigheten for avstandsmåling som er sikret med stereokameraer. Mer informasjon finner du på denne offisielle siden til Toshiba.
Toshiba vil bekrefte allsidigheten til systemet med kommersielt tilgjengelige kameraer og linser og øke hastigheten på bildebehandlingen, med sikte på offentlig implementering i regnskapsåret 2020.