Podle výzkumníků připravujících zprávu o své práci pro výroční zasedání IEEE o počítačovém vidění je řešení jednoho z nejtěžších problémů při pokroku počítačového vidění přímo aplikovatelné v oblasti rozpoznávání objektů a aktivit, ostrahy, stereo-mikroskopie a trojdimenzionální rekonstrukce tvaru. Hao Jiang a Stella X. Yu, počítačoví odborníci z Boston College, vyvinuli nové řešení lineárních algoritmů pro řízení práce počítače. Dříve se počítačová vizualizace spoléhala na software, který zachycoval živý obraz, a následně zkoumal miliony možných tvarů objektu a hledal shody. Úkol byl o to těžší, že při pohybu objektu, při kterém docházelo ke změně velikosti či orientace objektu, bylo nutné zkoumat ještě vyšší počet obrazů.

Namísto pročesávání databáze obrazů, kladoucího velké nároky na čas a paměť počítače, se Hao Jiang a Stella Yu ve snaze zajistit počítačům lepší vidění obrátili k mechanice lidského oka. „Hledá-li lidské oko nějaký objekt, hledá nejprve jeho přibližné místo, velikost a orientaci. Pak se zaměří na detaily," říká Jiang, odborný asistent na oddělení počítačové vědy. „Naše metoda se chová podobně a používá lineární aproximaci pro rychlé zkoumání prohledávaného prostoru; pak pracuje na identifikaci pohybujícího se objektu aktualizací prověřených oblastí hledání."

Prověřené oblasti hledání jsou základním kamenem, ke kterému se počítač znovu a znovu vrací. Řešení Hao Jianga a Stelly Yu se soustředí na matematicky generovaný vzor obrazu, který vypadá jako souhvězdí, když se mezi hvězdy zakreslí jejich spojnice. Při využití tohoto nového algoritmu počítačový software identifikuje objekt za pomoci vzoru prověřené oblasti hledání. Program pak přizpůsobuje prověřenou oblast hledání pohybu objektu, najde příslušné matematické shody, a přenese pohybující se obraz do paměťové banky nebo na počítačovou obrazovku (nahrání nebo zobrazení objektu).

Podle Jianga umožňuje použití lineární aproximace v sekvenci prověřených oblastí hledání novému programu zachovat si při pohybu objektu prostorovou konzistenci a snižuje počet proměnných, které je nutné optimalizovat, z několika miliónů na pouhých několik set. Tím se zvyšuje rychlost hledání shody obrazu oproti předchozím metodám desetkrát, dodává Jiang.

Vědci testovali software na řadě obrazů a videosekvencí (od motýla až po plyšového medvěda) a hlásí dosažení 95% přesnosti při dramaticky snížené úrovni složitosti. Dřívější tzv. "hladové" metody hledání shody vykazovaly míru detekce přibližně 50%, říká Jiang.

Jiang předložil výsledky výzkumu týmu na konferenci IEEE o počítačovém vidění a rozpoznávání obrazu, která se konala ve dnech 20.-25. června 2009 v Miami. 

 

22.6.2009

Zdrojový článek: ScienceDaily

Obrázek: Ubuntu fire yey wallpaper (WEBNESBAY, Linux)

Přeložila: Veronika Součková