Předzpracování obrazu

Obrázky (fotografie), které vidíme jako výsledek po vyfocení na svém monitoru nebo fotografii, jsou obrazy fotografované scény na níž jsou aplikované určité deformace díky nedokonalosti CCD čipů (ostatních snímacích zařízení), šumu prostředí, nežádoucího pootočení obrazu, či jeho prostorové deformace. To, jak nejlépe odstranit tyto nežádoucí efekty, souvisí s tím, jak dobře odhadneme operátor těchto degradací, označme ho , kde z je výsledný obraz po sejmutí a u je originální snímaný obraz(scéna).

Naším úkolem je tedy najít inverzní operaci, abychom zpětně z vyfocené fotky získali původní správný obraz , tedy

Formulace úlohy

Abychom mohli lépe rozeznat jednotlivé degradující vlivy, zapíšeme rovnici jako

kde je operátor pro geometrické zkreslení a deformace(natočení obrázku, změna měřítka, posunutí), značí konvoluci snímaného obrázku s impulzní odezvou zařízení, kterým snímáme(fotoaparát). Ideální snímací zařízení má impulzní funkci , tedy jednotkový pulz, značí šum v obraze. Tato rovnice a její řešení se nazývá Radiometric Inverze Problem a řešení se rozlišuje na případy:

  • Impulzní odezva je známa - je znám typ odezvy a i její parametry
  • Impulzní odezva je částečně známa - znám typ, ale neznám její parametry
  • Impulzní odezva není vůbec známa

Impulzní odezva je známa

Nejdříve se zabývejme řešením, kdy není přítomen na fotce šum ani geometrická deformace, tedy a . Řešíme tedy konvoluční rovnici , která v diskrétní oblasti (obrázek je reprezentován jako matice intenzit) přechází v soustavu lineárních rovnic. Mějme výsledný obrázek o rozměrech , dále známe impulzní odezvu i její parametry tedy např. gaussova tvaru:

Výpočet v obrázkové oblasti

Po provedení konvoluce dostáváme soustavu lineárních rovnic:

kde a jsou vektory o rozměru . Prvky obrázku v nich jsou seřazeny po řádcích:

A matice (soustava lin. rovnic složená z výpočtu konvoluce) má rozměry a následující tvar:

, kde B a D jsou také matice rozměru a tvaru:

Jak je vidět na první pohled, tak matice i jednotlivé její „bloky“ (B, D) jsou tridiagonální. Tyto matice jsou řešitelné poměrně jednoduše a rychle. Výsledkem tedy bude vektor , což je požadovaný obrázek před konvolucí s .

Výpočet ve frekvenční oblasti

Výpočet v obrazové oblasti je poměrně složitý (kvůli konvoluci), tak využijeme konvolučního teorému, který převádí konvoluci na násobení, což je nepoměrně rychlejší operace. Násobením je zde myšleno násobení (nebo dělení) po prvcích. Jestliže matice nemají stejný rozměr, tak se menší matice periodicky prodlouží na rozměr větší matice. Aplikujeme tedy Fourierovu transformaci na konvoluci a máme tedy:

Z toho si lehce vyjádříme původní obrázek , resp. jeho Fourierův obraz .

Pro obrazovou oblast tedy platí:

Tato metoda je používanější a nazývá se inverzní filtr ve frekvenční oblasti (anglicky: Inverse Filter in Fourier Domain).

Obrázek obsahující šum

Graf veličin N, H a N/H

V minulých odstavcích jsme předpokládali nulový šum, tedy všude v obrázku. Nyní ho nezanedbáme a použijeme na rekonstrukci obrázku inverzní filtr. Vycházíme tedy z

Provedeme Fourierovu transformaci a vyjádříme si obrázek před degradací.

,
.

Z této rovnice je vidět, že jsme v předchozích metodách (pro případ zašuměného obrázku) zanedbali člen . Tento člen ale dosahuje obrovských hodnot, takže tyto metody dávají velmi špatné výsledky při použití u zašuměných obrázků. Jako impulzní odezvu mějme standardní gaussovu funkci (). Její Fourierova transformace je opět gaussova funkce dělená jejím rozptylem (). Šum bereme libovolný, například takový, že jeho Fourierův obraz je konstantní funkce (ale není podmínkou, bereme jen pro jednoduchost). A protože gaussovka jde pro velké x k nule, tak její převrácená hodnota jde k nekonečnu a to násobené nějakým nenulovým šumem je zase velmi velké číslo (viz obrázek vpravo). Z toho plyne, že je při výpočtu zanedbán velmi významný člen. To je také důvod, proč se inverzní filtr moc nepoužívá. Místo něho se dá aplikovat na zašuměný obrázek Wienerův filtr, který dává o moc lepší výsledky.

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.