Automatsko apdejtovanje Google mapa

Svakoga dana Google mape (Google Maps) obezbeđuju milionima ljudi korisna uputstva kako stići do određene lokacije, snabdevaju ih biznis informacijama, pružaju uvid u saobraćaj u realnom vremenu…

Jasno je da Google mora kontinuirano da osvežava podatke, pošto se na terenu situacija neprekidno menja. Poznat vam je rad Street View automobila, koji prikupljaju milione snimaka svakog dana, ali kako pronaći i apdejtovati informacije kada je nemoguće manuelno obrađivati više od 80 milijardi do sada prikupljenih fotografija u visokoj rezoluciji?

Zadatak da reši problem i učini Google mape što tačnijim, uz pomoć automatskog čitanja iz geo-lokacijskih snimaka, dobio je Ground Truth Google tim.

Pristup velikom izazovu danas je dostupan, i objašnjen u prigodnom naučnom radu. U centru pažnje je model duboke neuronske mreže, sposoban da tačno čita imena ulica iz Street View snimaka, na mnogim jezicima. Predloženi algoritam dostigao je tačnost od 84,2% na komplikovanom uzorku fotografija francuskih saobraćajnih tabli, što je bolji rezultat od ranijih najnaprednijih rešenja. Što je još važnije, sistem se pokazao kao lako primenljiv i na druge informacije iz Street View materijala, pa je tako uz pomoć njega moguće čitati automatski nazive prodavnica i natpise na drugim biznis objektima. Veoma zanimljiva informacija za zainteresovane je da je model javno dostupan i može se preuzeti sa interneta.

Objasnićemo ukratko rešenje, uz nekoliko fotografija koje ga ilustruju.

Prepoznavanje teksta u prirodnom okruženju, u otvorenom prostoru, veliki je problem u oblasti mašinskog učenja i kompjuterskog “vida”. Dok se tradicionalni OCR (Optical Character Recognition) sistemi uglavnom fokusiraju na “viđenje” teksta u skeniranim dokumentima, natpise na ulicama je teže prepoznati, zbog distorzija, okluzija, nedostatka oštrine, ometajuće pozadine, ili dejstva mesta, odnosno ugla pod kojim je snimano.

U Google-u su istraživanje problema započeli 2008. godine, kada su neuronske mreže korišćene da bi se zaštitila privatnost zamagljivanjem lica i registarskih tablica u Street View fotografijama. Iz ovog posla zaključeno je  da se, sa dovoljnom količinom podataka, mašinsko učenje može koristiti i za automatsko apdejtovanje Google mapa.

Google-ov Ground Truth team je 2014. godine objavio tehnološki najsavremeniji metod za čitanje uličnih brojeva, u bazi podataka Street View House Numbers (SVHN), čiji je autor Ian Goodfellow. Rad nije bio namenjen samo akademskoj javnosti – zahvaljujući njemu danas je više od dve trećine adresa širom sveta preciznije. U nekim zemljama, kao što je Brazil na primer, algoritam je poboljšao podatke o više od 90% adresa, u velikoj meri unapređujući upotrebljivost mapa.

Sledeći logičan korak bio je da se metod proširi i na imena ulica. Kako bi ga izveli, u Google-u su kreirali i objavili test bazu podataka French Street Name Signs (FSNS), sa više od milion naziva ulica u Francuskoj. Baza je bila mnogo komplikovanija od prethodne, pošto se tačno prepoznavanje ulica zasnivalo na velikom broju različitih slika.

Primeri komplikovanih tabli koje je sistem tačno prepoznao uz pomoć izbora i kombinovanja različitih snimaka. Drugi primer je bio izrazito složen, ali je model uz pomoć obrasca prethodnog „jezičkog iskustva” uspeo da eliminiše višestuki smisao i tačno pročita ime ulice. U FSNS bazi podataka šum je korišćen kada je bilo dostupno manje od četiri snimka iste table.

Konačno, Zbigniew Wojna iz Google-a uspeo je, u toku leta 2016. da razvije arhitekturu modela dubinskog učenja koja automatski obeležava nove Street View fotografije. Jedna od interesantnih karakteristika modela je da može da prilagodi tekst čak i pravilima imenovanja, ignorišući pritom neodgovarajuće podatke.

Primer normalizacije teksta na podacima iz Brazila. “AV” je promenjeno u “Avenida”, a “Pres.” u “Presidente”, što je upravo ono što su istraživači želeli.
U ovom primeru model nije bio zbunjen činjenicom da postoje dva imena ulice, tačno tumačeći “Av” kao “Avenue” i, što je bitno, ignorišući broj “1600”.

Novi sistem, u kombinaciji sa onim koji prepoznaje ulične brojeve, dozvoljava da budu kreirane adrese direktno iz snimljenog materijala tamo gde prethodno nije bio poznat naziv ulice ili lokacija adrese. Konkretno, kad god Street View automobil prođe kroz novoizgrađene saobraćajnice, sistem može da analizira desetine hiljada snimaka koje napravi, prepozna i izdvoji iz njih imena ulica i brojeve, ispravno kreira nove adrese, i automatski ih locira u Google mapama.

Automatsko kreiranje Google Maps adresa za programere u Google-u nije bio jedini cilj – njihov zadatak je i da obezbede navigaciju do biznis objekata, pretragom na osnovu imena. U 2015. godini objavljeno je rešenje za tačno prepoznavanje biznis poslovnica na osnovu istaknutih firmi (natpisa) u Street View snimcima. Postupak je složen – pošto se otkrije natpis na ulici, potrebno je tačno izolovati deo koji je koristan (u Google-u ovo nazivaju izolovanje “strukturiranog teksta”). Model mora, dakle, da razlikuje poslovno ime od drugih reči u tekstu koje su nevažne, odnosno ne samo da razlikuje tekst, nego da ima u vidu značenje koje mu se pridaje.

Sistem je tačno kao poslovno ime obeležio “Zelina Pneus”, iako nije imao nikakav podatak o poziciji imena na slici. Nisu ga zbunili ni brendovi pneumatika na tabli, koji informišu kupca koje gume može da kupi u prodavnici!

Arhitektura modela koja se koristi za čitanje imena ulica, zaključak je, može da se upotrebi i za tačno prepoznavanje biznis imena sa fasade. Kada se poslovno ime izoluje, proverava se postoji li ono već u Google mapama, a krajnji cilj su – što tačniji i ažurniji biznis listinzi za korisnike.

Primena navedenih modela na više od 80 milijardi Street View snimaka zahteva moćne kompjutere. Zbog toga je Ground Truth tim prvi korisnik Google TPU (Tensor Processing Unit) čipova veštačke inteligencije, koji su se pojavili početkom godine. Njihove performanse obezbeđuju drastično ubrzanje procesa zaključivanja u neuronskoj mreži.

Vratimo se na početak. Ljudi se oslanjaju na tačnost Google mapa i očekuju da im one pomognu. Apdejtovanje Google mapa u uslovima stalno promenljive situacije u gradovima, na putevima i u biznis podacima predstavlja tako složen tehnički izazov da je potpuno rešenje još uvek daleko.

Google Truth tim nastavlja da radi na tehnološki najsavremenijim inovacijama u mašinskom učenju, kako bi obezbedio bolje iskustvo za više od milijardu korisnika Google mapa. Pratićemo njihova otkrića i ubuduće.

Leave a Comment

Ваша адреса е-поште неће бити објављена. Неопходна поља су означена *

to top