Download - Szegmentáló algoritmusok légi- és · változáskövetésre (pl. városok terjeszkedése). Jelen dolgozatban els ősorban mez őgazdasági, és a mez őgazdasághoz kapcsolódó

Eötvös Loránd Tudományegyetem Informatikai Kar Algoritmusok és Alkalmazásaik Tanszék

Szegmentáló algoritmusok légi- és

űrfelvételek osztályozásában

Diplomamunka

Készítette:

Gera Dávid Ákos programtervező matematikus szak

nappali tagozat

Témavezetők:

Dr. Fekete István László István egyetemi docens osztályvezető

ELTE Informatikai Kar Földmérési és Távérzékelési Intézet

Budapest 2011

A projekt az Európai Unió támogatásával, az Európai Szociális Alap társfinanszírozásával valósul meg (a támogatás száma TÁMOP 4.2.1./B-09/1/KMR-2010-0003).

Tartalomjegyzék 1. Bevezetés ...................................................................................................................... 3 2. A távérzékelés alapjai................................................................................................. 6

2. 1. Fizikai alapok........................................................................................................ 7 2. 2. Felvételkészítés..................................................................................................... 9 2. 3. Előfeldolgozás .................................................................................................... 11

3. A távérzékelt felvételek kiértékelése ....................................................................... 13 3. 1. Intenzitástér......................................................................................................... 14 3. 2. Klaszterezés ........................................................................................................ 14 3. 3. Felügyelt osztályozás.......................................................................................... 15 3. 4. Maximum-likelihood módszer............................................................................ 16 3. 5. Távolságfüggvények........................................................................................... 17

4. Szegmensalapú képfeldolgozás ................................................................................ 18 4. 1. A textúra ............................................................................................................. 18 4. 2. Szegmensalapú osztályozás ................................................................................ 20 4. 3. Objektum alapú képelemzés ............................................................................... 21

5. Szegmentáló eljárások .............................................................................................. 23 5. 1. A szegmentáló eljárások áttekintése ................................................................... 23

5. 1. 1. Hisztogram alapú szegmentálás.................................................................. 23 5. 1. 2. Él alapú szegmentálás................................................................................. 25 5. 1. 3. Régió-alapú szegmentálás........................................................................... 26 5. 1. 4. A szegmentálás, mint gráfelméleti probléma............................................. 27

5. 2. Összevonás-alapú szegmentálás ......................................................................... 27 5. 2. 1. Szekvenciális csatolás................................................................................. 27 5. 2. 2. Legjobb összevonás .................................................................................... 29 5. 2. 3. Gráf alapú összevonás ................................................................................ 30

5. 3. Vágás-alapú szegmentálás .................................................................................. 31 5. 3. 1. Minimális átlagsúly alapú vágás................................................................. 31 5. 3. 2. Minimális arány alapú vágás ...................................................................... 33 5. 3. 3. Normált minimális vágás ............................................................................ 34

6. Gyakorlati feladatok megoldása a Definiens eCognition programrendszerrel .. 36 6. 1. Gyakorlati alkalmazások..................................................................................... 36 6. 2. A Definiens eCognition programrendszerről...................................................... 37 6. 3. Az eCognition szegmentáló eljárásai.................................................................. 38 6. 4. Osztályozás végrehajtása .................................................................................... 46

7. Fák lehatárolása (MePAR felújítás)........................................................................ 48 7. 1. A felhasznált felvételek ...................................................................................... 49 7. 2. A feldolgozás folyamata ..................................................................................... 49 7. 3. Szegmentálás ...................................................................................................... 50 7. 4. Osztályozás ......................................................................................................... 54 7. 5. Utófeldolgozás .................................................................................................... 59 7. 6. Pontosság ............................................................................................................ 60 7. 7. Javítási lehetőségek............................................................................................. 61

8. Vörösiszap-elöntés (katasztrófa-felmérés).............................................................. 62 8. 1. A felhasznált felvételek ...................................................................................... 62 8. 2. A feldolgozás folyamata ..................................................................................... 63 8. 3. Spektrális indexek............................................................................................... 63 8. 4. Szegmentálás ...................................................................................................... 64

8. 5. Osztályozás ......................................................................................................... 67 8. 6. Pontosság ............................................................................................................ 69 8. 7. A RapidEye felvétel feldolgozása, összehasonlítás............................................ 69

8. 7. 1. A RapidEye felvétel szegmentálása............................................................69 8. 7. 2. A RapidEye felvétel osztályozása............................................................... 70

9. Parlagfű kimutatás objektum alapon ..................................................................... 74 9. 1. Felhasznált felvételek ......................................................................................... 74 9. 2. A feldolgozás folyamata ..................................................................................... 75 9. 3. Szegmentálás ...................................................................................................... 75 9. 4. Osztályozás ......................................................................................................... 76 9. 5. Pontosság ............................................................................................................ 77

10. Összegzés.................................................................................................................. 79 A. Függelék .................................................................................................................... 80

A. 1. Adatszerkezetek ................................................................................................. 80 Éllistás gráfreprezentáció........................................................................................ 80 Bináris kupac .......................................................................................................... 80

A. 2. Négyfa alapú szegmentálás................................................................................ 81 Irodalomjegyzék............................................................................................................ 82

- 3 -

1. Bevezetés

A bevezető fejezetben röviden összefoglalom azokat az általános ismereteket, amelyek

diplomamunkám jobb megértéséhez szükségesek.

A távérzékelés, mint a térinformatika speciális része egyetemi tanulmányai során

keltette fel érdeklődésemet. A térképek iránti érdeklődésem gyermekkorom óta megvan,

így a térképek és az informatika kapcsolódása, a térinformatika irányába való

fogékonyságom is természetes. Ez az érdeklődés a Térinformatikai sáv keretében

tanulmányaimban is fontos helyet kaphatott. Döntésem helyességét a sáv tantárgyai

megerősítették, a Távérzékelt Felvételek Elemzése kurzusban pedig megtaláltam azt a

szűkebb szakmai irányvonalat, melyet követni szeretnék. Ennek a specializált

érdeklődésnek megfelelően kooperatív képzésre jelentkeztem a Földmérési és

Távérzékelési Intézetbe (FÖMI), a Távérzékelési Igazgatóságra (TÁI). A képzés után az

Intézet részmunkaidős munkatársa maradtam.

Diplomamunkám témáját is meghatározta ez a körülmény. A FÖMI-ben olyan

feladatokat kaptam, amelyek illeszkednek az ELTE IK – FÖMI TÁI közötti

együttműködés keretében több éve folyó kutatáshoz. A közös kutatás témája a

távérzékelt felvételek szegmentálási módszereinek, és a felvételek szegmensalapú

kiértékelésének a vizsgálata. Az együttműködés eddigi eredményeit (fejlesztéseket és

publikációkat) a dolgozat 4. fejezetében részletesen ismertetem.

A FÖMI-ben végzett munkáim közül három olyan feladat is szerepel, amelyek

megoldásban a felvételek szegmentálását kellett, illetve lehetett alkalmazni. A

szegmentálás a Definiens eCognition objektum-alapú képfeldolgozó program-rendszer

felhasználásával történt. A szegmentálás és az annak eredményére épülő objektum-

alapú elemzés kulcslépése a széleskörű paraméterezési lehetőségek megfelelő

kihasználása, ami az alkalmazást nagyon hatékonnyá teheti, ugyanakkor komoly

nehézségek forrása is lehet a rendszer érzékenysége a paraméterek helyes

megválasztására. A helyes alkalmazáshoz nélkülözhetetlen az emberi szakértelem,

- 4 -

amely egyaránt kiterjed a felvételek interpretációjára és a szegmentáló eljárások

működésére.

A FÖMI egyik legfontosabb, legnagyobb emberi erőforrásokat igénylő feladata a

mezőgazdasági támogatási rendszert felügyelő Mezőgazdasági Parcella Azonosító

Rendszer (MePAR) üzemeltetése és folyamatos felújítása. A bemutatott első alkalmazás

célja a rendszerben legelőként támogatható területeken megjelenő fás, bokros területek

légifelvételeken történő lehatárolása. A feladat jellege szükségessé teszi a szegmens

(objektum) alapú megközelítést. A bemutatott alkalmazás egy összetett térinformatikai

folyamat része, melynek célja a lehatárolás automatizálása.

A távérzékelés egyik legnagyobb erőssége a légi- és űrfelvételeken is látható

környezeti és ipari katasztrófák gyors és érintkezésmentes felmérésének és elemzésének

lehetősége. A FÖMI-ben rendszeres feladatok az ár- és belvízfelmérés, aszályfelmérés,

vagy például valamilyen mezőgazdasági kártevő kártételének vizsgálata. A másodikként

bemutatott alkalmazás azonban egy egyedi esemény, a 2010 októberében bekövetkezett

vörösiszap-elöntés hatását mérte fel. Ezen vizsgálatok keretében – elsősorban kutató

jellegű – szegmensalapú elemzéseket végeztem szuperfelbontású űrfelvételeken.

Minden évben ismétlődő fontos feladata az Intézetnek a parlagfű-fertőzöttség

elleni közérdekű védekezés támogatása távérzékeléses módszerrel. A hagyományosan

alkalmazott terepi ellenőrzésekkel megerősített idősor-alapú módszer mellett a 2010-es

évben egy a szuperfelbontású felvételek feldolgozási lehetőségeire irányuló kutatási

folyamat részeként az ilyen felvételek parlagfű-kimutatásra való alkalmasságát is

megvizsgáltuk. Ennek a folyamatnak része a harmadik gyakorlati alkalmazásként a 9.

fejezetben bemutatott általam végzett objektum-alapú feldolgozás.

Diplomamunkám felépítése a következő. A 2-3. fejezetben nagyon röviden

összefoglalom a távérzékelés (tanult) alapjait, az alkalmazott tartományra (passzív

távérzékelés az optikai tartományban) szűkítve. A 4-5. fejezetben áttekintem a

felvételek szegmentálásának és a szegmensalapú kiértékelésének módszereit, különös

tekintettel az ELTE-FÖMI közös kutatás eredményeire. A 6-7-8-9. fejezetekben

bemutatom a fenti három alkalmazást és az alkalmazott programrendszert. Végül, a 10.

fejezetben a dolgozat összegzése olvasható. Az Irodalomjegyzésben – tematikus

- 5 -

csoportosításban – csak olyan források szerepelnek, amelyeket a dolgozat megírásában

felhasználtam, hivatkozás azonban a szövegben nem történik rájuk.

A bemutatott alkalmazások a leírtaknál összetettebb, komplex feladatok részei, e

feladatokról – melyek csapatmunka eredményei – több társszerzős publikációban

(három angol, egy magyar nyelvű cikk, egy poszter, két előadás) számoltam be.

- 6 -

2. A távérzékelés alapjai

A távérzékelés elektromágneses hullámok rögzítését és az így nyert információrendszer

feldolgozását jelenti. A vizsgálat tárgya általában a föld- és a vízfelszín, a növénytakaró

és a talaj felső rétegei. A érzékelő műszer nincs közvetlen kapcsolatban a vizsgálat

tárgyával, általában repülőgépen, vagy műholdon elhelyezett szenzor, de léteznek

eszközök, melyek csupán a felszín felett néhány méterrel dolgoznak. A levegőből vagy

a világűrből történő felvételezés lehetővé teszi nagy területek átfogó vizsgálatát,

továbbá a terepi viszonyok, a célterület megközelíthetetlensége nem nehezítik az

elemzést. A mért elektromágneses sugárzás forrása lehet a Nap, az érzékelő műszer,

vagy maga a vizsgált objektum is. Az első két esetben a felszín által visszavert sugárzást

mérjük. Ez esetben megkülönböztetünk passzív, illetve aktív távérzékelést. Passzív

rendszer esetén a sugárzás forrása a Nap, a mért hullámhossz-tartomány az optikai

tartomány egy része. Aktív rendszer esetén a sugárzás forrása maga a mérőeszköz, a

mért hullámhossz a mikrohullámú tartományba esik. A nyert adatok általában képszerű,

többsávos felvétel formájában kerülnek feldolgozásra. A távérzékelt felvétel

kiértékelése a felvételezett objektumok, folyamatok paramétereinek matematikai alapon

történő meghatározását jelenti, a kiértékelés eredménye általában a kiértékelési

szempontok szerinti kategóriákat tartalmazó tematikus térkép. A felszíni objektumok

tematikus kategóriákba sorolása az osztályozás.

1. ábra: légifelvétel és tematikus térképe

- 7 -

Természetesen a távérzékelés első alkalmazása is katonai célokkal történt. A civil

felhasználásra a környezeti erőforrás-kutatás hatékonyságának növekvő jelentősége

adott lehetőséget. Napjainkban a távérzékelést alkalmazzák mezőgazdasági,

környezetvédelmi célokkal, természeti katasztrófák hatásának vizsgálatára,

változáskövetésre (pl. városok terjeszkedése). Jelen dolgozatban elsősorban

mezőgazdasági, és a mezőgazdasághoz kapcsolódó katasztrófavédelmi (a 2010 őszén

történt vörösiszap elöntés) alkalmazásokról lesz szó.

A távérzékeléses elemzés átfogó mivolta és terepfüggetlensége mellett további

előnye a gyorsasága, és a képi jellegű adatok feldolgozhatósága, valamint relatív

olcsósága. Ugyanakkor megemlítendő nehézséget jelent a leggyakrabban használt,

optikai tartományban történő felvételezés időjárás-függősége, a felvételek

kiértékelésének rendszer-, és szakember-igénye, illetve a kiértékelés pontosságának

kérdése.

2. 1. Fizikai alapok

A már említett passzív és aktív távérzékelési rendszerek közül a továbbiakban

csak a passzív rendszerrel foglalkozunk. E rendszereknél az érzékelt elektromágneses

hullámok forrása általában a Nap, a szenzor a felszínről visszavert sugárzást rögzíti. A

passzív távérzékelésben használt hullámhossz-tartomány jellemzően a 0.3 - 15µm

közötti, úgynevezett optikai tartomány.

2. ábra: az optikai hullámhossz-tartomány részei

- 8 -

A mezőgazdasági távérzékelés elsősorban az optikai tartomány látható, közeli és

közepes infravörös részét használja. A passzív távérzékelés időjárás-függő módszer, a

felszínről kiértékelhető felvétel csak nappal és tiszta időben készíthető, továbbá

figyelembe kell venni az optikai tartomány légköri vízelnyelési sávjait, azaz azon

hullámhossz-tartományokat, ahol a légkörben lévő víz a sugárzást elnyeli. A szenzorok

ezen intervallumokban nem felvételeznek. Fontos fizikai tényezők továbbá a Nap állása,

és a légköri szórás, melyek befolyásolják a készített felvételt. E hatások

kiküszöbölésére, különösen több felvétel együttes kiértékelésénél fontos a légköri

korrekció, az ún. Top-of-the-Atmosphere (ToA) reflektanciakép előállítása. (az ehhez

szükséges adatok a felvétellel együtt elérhetőek).

A reflektancia függvény: a hullámhossz tartományban a visszavert sugárzási érték

a különböző felszíni objektumokra jellemző görbét ír le. Ez alapján elkülöníthető

felszínborítások például a vízfelület, különböző talajtípusok, zöld növényzet.

3. ábra: jellemző reflektanciagörbék

Az ábrán látható a zöld növényzetre jellemző reflektancia görbe összetettsége. A

látható hullámhossz-tartomány visszaverési minimumait a klorofill-elnyelés, a közepes

infravörös tartomány minimumait a növény víztartalma okozza. Ezekből az adott

növénytípus fejlettségi szintjére, egészségességére is következtethetünk. A görbe a

növény fejlődésének különböző szakaszaiban jellemző módon változik. Hasonló módon

a különböző talajok tulajdonságai is leolvashatóak. Az egymáshoz spektrálisan nagyon

- 9 -

hasonló növénytípusok elkülönítéséhez a felvételezés időpontja, több időpontban

készült felvétel együttes elemzése (idősor) ad segítséget.

Az egyes felszíni objektumok egyértelmű azonosítása ugyanakkor nem lehetséges

a reflektancia görbék alapján, ugyanis a mért értékeket technikai (pl. felbontás) és

környezeti tényezők (pl. az objektum állapota, környezetében található más felszíni

objektumok) erősen befolyásolják.

2. 2. Felvételkészítés

A felvételeket többféle fizikai mértékkel jellemezhetjük. A spektrális felbontás a

felvételezhető hullámhossz-tartomány szélességét és részletességét jellemzi. A térbeli

felbontás az egy képpontra eső felszín területét adja meg. Műholdakon elhelyezett

szenzoroknál további fontos jellemzők a visszatérési idő – azaz a műhold milyen

gyakran halad át ugyanazon földi pont felett, illetve az egy felvétellel lefedhető terület

nagysága.

A felvételkészítő eszköz hordozója általában repülőgép, vagy műhold. Az optikai

tartományban működő passzív rendszerek két fő típusa a fényképező típusú és digitális

pásztázó letapogató rendszer.

Az analóg és digitális fényképező rendszerek a látható és a közeli infravörös sáv

egy részét használják (kb. 0,4 – 0,9 µm). A szenzor a teljes felvételezendő területet

egyszerre rögzíti. Fontos szerepe van a színes infravörös (CIR – color infra red)

felvételeknek, a dolgozatban bemutatott egyik gyakorlati alkalmazás bemenő adatai is

CIR orthokorrigált (térképhelyes) légifelvételek. Ezen rendszereket általában

repülőgépek hordozzák, a felvételekre gyenge spektrális felbontás mellett nagyon jó

térbeli felbontás jellemző.

A többsávos digitális pásztázó letapogatók elsősorban műholdak fedélzetén

működnek. A szenzor a földfelszín repülésre merőleges sávjáról érkező

elektromágneses sugárzás-intenzitást rögzíti, a teljes felvétel e sávokból áll össze. Az

így készült digitális felvétel egy mátrix, melyet soronként tölt fel a szenzor. Az egyes

- 10 -

mátrixértékek (a pixelek) vektorok, melyek dimenziószámát a felvételnél használt sávok

száma adja. A digitális felvételek a fényképező rendszereknél nagyobb spektrális

felbontást tesznek lehetővé, térbeli felbontásuk a kis felbontású (1100m) elsősorban

meteorológiai célú eszközöktől a nagyon nagy felbontásúig (akár 0,5m) terjed.

A mezőgazdasági távérzékelésben elsősorban nagyfelbontású (HR - High

Resolution) és nagyon nagy-, vagy más néven szuperfelbontású (VHR - Very High

Resolution) felvételeket alkalmazunk, a jelen dolgozatban leírt módszerek és

alkalmazások is ilyen típusú felvételeken használhatóak. HR felbontású felvételeket

szolgáltatnak például az Awifs (60m-es térbeli felbontás), a Liss (20m), a SPOT (20m

illetve 10m) és a Landsat TM (25m) szenzorok, VHR felbontásúak például a RapidEye

(5m), és a WorldView2 (2m), az orthofotók szintén VHR felbontásúak.

A felvételek feldolgozása a szükséges geometriai és radiometriai korrekciók

elvégzése után számítógépes úton, a digitális képelemzés módszereivel történik. Az

optikai tartományban jellemzően használt sávok a látható zöld és vörös, valamint a

közeli és közepes infravörös hullámhossz-tartomány egyes részei. Egyes szenzorok

felvételeznek az optikai kék tartományban, vagy a vörös és közeli infravörös sáv

határán, az ún. „red edge” (vörös-határ) sávban.

A felvételkészítés során a szenzor a felszíni objektumok reflektanciafüggvényét

az egyes sávoknak megfelelő hullámhossz-intervallumokban mintavételezi, majd

kvantálja. A kvantálás finomsága szintén fontos jellemzője az egyes felvételkészítő

eszközöknek.

Egyes szenzorok alkalmasak ún. pankromatikus felvétel készítésére is, ekkor a

felvételezés általában a látható kék – vörös-határ tartományban történik, egy sávon, a

multispektrális (nem pankromatikus) felvételezésnél nagyobb térbeli felbontással és

finomabb kvantálással.

A többsávos távérzékelt felvételek képként való megjelenítésekor ki kell

választani a megjelenítendő sávokat, és hozzárendelni azokat a megjelenítő eszköz

(vörös, zöld és kék) színpuskáihoz. Az így megjelenített képet kompozitnak nevezzük.

Gyakran alkalmazott a valódi színes kompozit, ami a természetes megjelenítésnek felel

- 11 -

meg, vagyis a felvétel vörös, zöld és kék komponensét rendre a megjelenítő vörös, zöld

és kék színpuskájához rendeljük. Szintén sokszor előfordulnak az ún. hamisszínes

kompozitok, amikor a megjelenítő vörös, zöld, kék színpuskáihoz rendre a felvétel

közeli infravörös, vörös és zöld, vagy közeli infravörös, közepes infravörös, vörös

sávjait rendeljük. Hamis színes kompozitokon a növénytakaró jellegzetes vörös színben

látszik.

2. 3. Előfeldolgozás

Már említettük, hogy az elkészült felvételt a légkör állapota, a Nap állása

befolyásolja. E mellett a felvételt számos további hiba terheli. Ezek egy része

geometriai hiba, melyeket a műhold mozgása, a Föld forgása és a nagy látószögből

valamint a felszín görbületéből adódó torzítás okoz. A durva geometriai hibák

korrekcióját a felvevő rendszer (a földi vevőállomáson) elvégzi. További szükséges

geometriai korrekció a felvétel vetületi rendszerbe transzfomálása, melyet

referenciapontok alapján, vagy vetületi rendszerek közötti transzformációs

függvényekkel végeznek. Természetesen az utóbbi módon csak már valamilyen

vetületben lévő felvétel transzformálható. Magyarországon általában az Egységes

Országos Vetületi Rendszert (EOV) használjuk.

A geometriai mellett adódnak radiometriai hibák is. Ezek egy részének

kiküszöbölését szolgálja a már említett ToA reflektancia előállítása. További,

elsősorban a vizuális kiértékelést segítő korrekciók a digitális képfeldolgozásból ismert

hisztogram-műveletek, élesítés, konvolúciós szűrések. Míg a ToA reflektancia

előállítása elengedhetetlen a további feldolgozáshoz, a képi látványt javító műveletek

oly módon változtatják meg a képet, hogy utána nem alkalmazhatjuk a képanalízis

egyes lépéseit.

A radiometriai hibák javítása mellett a további feldolgozásban is szükség van az

elemi képstatisztikák kiszámítására. Ezek egyrészt a sávonkénti statisztikák (átlag,

intervallum, szórás, hisztogram), valamint a több sáv együttes viselkedését leíró

kovariancia és korrelációs mátrix. A spektrális indexek szintén fontos elemei a

feldolgozásnak. Ezek több sáv pixelenkénti értékeiből számolt újabb képrétegek. A

- 12 -

leggyakrabban használt index az NDVI (Normalized Difference Vegetation Index –

vegetációs index), mely a közeli infravörös (NIR) és a látható vörös (R) sávokból, a

következő képlettel adódik: NDVI = (NIR-R)/(NIR+R), ennek értéke a [-1, 1]

intervallumba esik. A vegetációs index a zöld (fotoszintetizáló) növényzetre jellemző

spektrális tulajdonságot (magas visszaverés a közeli infravörös, alacsony a látható vörös

tartományban) emeli ki. Hasonló módon más sávokból is képezetők spektrális indexek.

- 13 -

3. A távérzékelt felvételek kiértékelése

A szükséges előfeldolgozási műveletek után a felvétel alkalmas a tényleges

kiértékelésre. A kiértékelés célja a felszínborítási elemek minél több

állapothatározójának pontos, megbízható becslése, és ezek alapján a célkategóriák

tematikus térképének előállítása. E célkategóriákat az elvégzendő feladat határozza

meg. Ezek lehetnek különböző haszonnövények, talajtípusok, katasztrófa-felmérésnél

(pl. belvíz) érintettségi fokozatok. A tematikus térkép elkészítése minden egyes képpont

(pixel) valamely kategóriába sorolását jelenti, a lehető legkisebb hiba mellett. A

térképet előállító eljárástól elvárt a megfelelő (és igazolható) pontosság, gyorsaság és

ismételhetőség.

A kiértékelés alapmódszerei a vizuális értelmezés és a digitális képelemzés. Az

eljárás általában komplex, mindkét módszer elemeit használja, az adott feladat

függvényében. A vizuális kiértékeléssel szemben a számítógépes feldolgozástól

természetes elvárás a gyorsaság, a nagy adatmennyiségek együttes hatékony kezelése,

ezek mellett a tónusbeli különbségek (az emberi szem még a könnyebben elválasztható

színekben is csak 8-10 árnyalatot képes megkülönböztetni) és a textúrák mérésében is

erősebb. Ugyanakkor nem elhanyagolandó, hogy a megfelelő szaktudású személy által

végzett vizuális interpretáció a geometriai összefüggések, textúrák felismerésében jóval

hatékonyabb a számítógépes kiértékelésnél. A kiértékelő módszer tudományosan

megalapozott kell legyen, a folyamatnak csak egy része a felvétel készítése (beszerzése)

és feldolgozása. Még ezek előtt szükséges a célok pontos meghatározása, és a fizikai,

adat és megoldási modellek létrehozása. Az adatgyűjtést is megfelelően alaposan kell

elvégezni, egyes feladatokban terepi adatgyűjtésre is szükség lehet.

Ezek után a tematikus térkép elkészítésének fő lépése az osztályozás. Az

osztályozás során minden egyes képpont besorolást nyer valamely – pontosan egy

tematikus osztályba. A célosztályok mellett használunk egy ún. „egyéb” kategóriát is, a

semelyik célosztálynak sem megfelelő képpontok számára.

- 14 -

A felvételezett sugárzási kép visszaszámítása földi paraméterekre lehetetlen, az

osztályozás statisztikai döntéselméleti módszerekkel végezhető. Alkalmazunk

felügyelet nélküli és felügyelt osztályozást. A klaszterező eljárások felügyelet nélküli

osztályozást valósítanak meg. Ezek bemutatása előtt definiáljuk az intenzitástér

fogalmát.

3. 1. Intenzitástér

A felvétel a képtérben természetes módon jelenik meg. A tengelyek a térbeli

(síkbeli) koordináták, a tér elemei intenzitásvektorok. Ugyanakkor a felvétel

ábrázolható az intenzitástérben is, ahol a koordináta-tengelyek az egyes spektrális

sávok, az értékek pedig az adott intenzitású pontok száma. A hisztogramhoz hasonlóan

az intenzitástér is független az egyes képpontok térbeli elhelyezkedésétől, azaz a

felvétel pixeljeit a képtérben tetszőlegesen permutálva az intenzitástérben nem változik

meg. Az intenzitástér dimenziója a kép spektrális sávjainak száma, ábrázolása

értelemszerűen két (vagy három) sáv felhasználásával történik. Az intenzitástérben az

egyes sávokra jellemző viselkedés mellett az „együttmozgások”, vagyis a különböző

sávok értékei közötti összefüggések is megfigyelhetőek. Az azonos felszíni objektumok

képpontjai az intenzitástérben jellemző csoportokat alkotnak.

4. ábra: Landsat TM felvétel az intenzitástérben

3. 2. Klaszterezés

Az intenzitástérben az egyes tematikus osztályok pixelei csoportosulnak, és e

csoportok elkülönülnek egymástól. Ilyen adatcsoportosulások egy kategórián belül is

- 15 -

előfordulhatnak, illetve előfordulhat olyan csoport, amelynek elemei nem egy tematikus

kategóriához tartoznak.

Az adatcsoportosulások neve spektrális adatosztály, röviden klaszter (cluster). A

klaszterező eljárás az intenzitásteret bontja fel diszjunkt adatcsoportosulásokra, azaz

minden képponthoz hozzárendel pontosan egy osztályt. Természetesen ezek az

osztályok nem, vagy csak részben felelnek meg a tematikus kategóriáknak, a kapott

klasztertérkép tekinthető spektrális sugárzási térképnek. Az eljárás felügyelet nélküli,

ugyanis a klaszterek lehatárolása matematikai úton, előzetes információk (pl.

tanulóterület) felhasználása nélkül történik.

Egy klaszterező eljárás az ISODATA klaszter-kereső algoritmus leegyszerűsítve:

1. első lépésben kiválasztunk megfelelő számú klaszterközéppontot (pl. az

intenzitástérben egyenletesen)

2. minden képpontot besorolunk a hozzá legközelebbi klaszterhez

3. meghatározzuk az új középpontokat (a klaszterbe tartozó képpontok

átlagvektora)

4. megvizsgáljuk a klaszterek változását, ha ez „nagy”, akkor vissza a 2. pontra,

különben

5. kialakultak a klaszterek

A képpontok távolságának meghatározása legkisebb négyzetek módszerével

történik. Ez adott darabszámú ci klaszter mellett a következő érték minimalizálását

jelenti:

∑∑∈

−i ic cx

icx 2)(

Az eljárás alkalmazásakor megszorítás tehető a méretre, elemszámra, lehetőséget

adhatunk közeli klaszterek összevonására, túl nagy klaszter szétvágására.

3. 3. Felügyelt osztályozás

A módszer alapja a célkategóriák rendelkezésre álló (pl. terepi felmérésből)

reprezentatív mintája. Ezeket a mintákat kategóriánként két diszjunkt halmazba sorolva

kapjuk az ún. tanuló- és tesztterületeket. Feltételezve az azonos tematikus kategóriába

- 16 -

tartozó objektumok spektrális hasonlóságát, a kategóriák tanulóterületen való spektrális

viselkedéséből megkapjuk a felvétel egészének osztályozását. A kapott eredmény a

tesztterület alapján ellenőrizhető, nem megfelelő eredmény esetén paraméterek

megváltoztatásával javíthatunk a kiértékelésen.

Az egyes képpontok besorolására gyakran alkalmazott a becsléselméletből ismert

maximum-likelihood döntés, de létezik különböző távolságfüggvényeket használó,

valamint mesterséges neuronhálókon alapuló osztályozási eljárás is.

A felügyelt osztályozás pontossága vizsgálható a tévesztési mátrix segítségével. A

mátrix sorait az osztályozás során kapott értékekből, oszlopait a referencia-adatokból

(teszt-területek, referenciatérkép) kapjuk. A különböző kategóriába tartozó elemek közt

előforduló spektrális átfedések miatt a „legpontosabb” osztályozási folyamatban is

előfordul hibás döntés egyes képpontokról. A hibaelemzést mindig az adott feladat

függvényében kell végezni, megkülönböztetve az első és másodfajú hibákat. A hibák

statisztikai leírására szolgáló tévesztési mátrix mellett a térbeli jellemzésre hibatérkép

készíthető.

3. 4. Maximum-likelihood módszer

Az egyes kategóriák az intenzitástérben nem pontszerűen vannak jelen, spektrális

értékeik az előfordulási valószínűségi értékekkel jellemezhetők. Ezt a valószínűséget a

tanulóterületről vett értékek definiálják. Az ismeretlen hovatartozású képpont abba az

osztályba kerül, amely osztályhoz a legnagyobb valószínűséggel tartozik. Az egyes

kategóriák átfedései miatt az osztályozás nem hibamentes, ugyanakkor belátható, hogy

a maximum-likelihood módszer optimális a hibák valószínűsége szempontjából.

Gyakran szükség van az osztályozási hibák súlyozására, ehhez készíthető

veszteségmátrix, melyben a téves osztályozásokhoz rendelhetünk hibasúly-értékeket. A

veszteségi mátrix figyelembe vételével zajló maximum-likelihood döntés elnevezése

Bayes-osztályozás, ekkor a hibákból származó összes veszteséget kívánjuk

minimalizálni.

- 17 -

5. ábra: sűrűségfüggvények átfedése - az osztályozási hibák forrása

3. 5. Távolságfüggvények

Az osztályozási folyamat befolyásolható a képpontok vagy osztályok

távolságának definiálása. A legkisebb négyzetek módszerét a felügyelet nélküli

osztályozásnál már említettem. Osztályok távolságát sűrűségfüggvényük átfedésével

mérhetjük. Ilyen távolságfüggvény a divergencia:

∫ −=x j

iji dx

xp

xpxpxpjiD

)|(

)|(ln))|()|((),(

ωωωω

ahol ωi és ωj az osztályok sűrűségfüggvényei, )|( ixp ω pedig az x elem i. osztályba

való tartozásának valószínűsége. Hasonló mértékek a Jeffries-Matusita távolság:

∫ −=x

ji dxxpxpjiJ 2))|()|((),( ωω

és a Bhattacharrya távolság:

∫=x

ji dxxpxpjiB )|()|(),( ωω

- 18 -

4. Szegmensalapú képfeldolgozás

A pixel-alapú osztályozás gyakori hibája a képpont önmagában, környezetétől

függetlenül való vizsgálatából ered. Jellemzően egy homogén felszínborítás egyes

pontjai az átlagtól eltérhetnek, emiatt az ilyen pixelek más kategóriába nyerhetnek

besorolást, mint ahova környezetével együtt valójában tartozik. További problémát

jelent, hogy szuperfelbontású felvételek esetén a képi egység kisebb lehet, mint a

tematikus kategória egységei, azaz a felvételen egy objektum több, önmagukban

helyesen nem értelmezhető képpontból épül fel.

A pixel-alapon végzett osztályozás az egyes képpontoknak csak a spektrális

tulajdonságai alapján történik. Ugyanakkor a felvételek alkalmasak környezeti

viszonyok, geometriai tulajdonságok, texturális mértékek figyelembe vételére is. Ahogy

említettük, a geometriai összefüggések és texturális jellegzetességek felismerésében a

számítógépes kiértékelésnél hatékonyabb a vizuális interpretáció.

4. 1. A textúra

A textúra (mintázat) a képpont környezetének szabályos intenzitásváltozása.

Létezik determinisztikus és sztochasztikus textúra. A determinisztikus textúrák szigorú

szabályok szerint ismétlődő mintákból állnak, ilyen például egy sakktábla mintázata. A

sztochasztikus textúrát valamilyen statisztikai törvényszerűség határozza meg, ilyenek

például a szomszédos, azonos felszíni objektumot alkotó képpontokban kirajzolódó

mintázatok (elsősorban HR és VHR felbontásban).

A textúra mérésére többféle texturális mértéket használhatunk, melyek

megfogalmazása a pixelek közelében lévő többi képpont intenzitásával történik.

Mérhető a környezetben lévő azonos, vagy eltérő intenzitások gyakorisága. E mértékek

alapján vizsgálható szomszédos képpontok összetartozása vagy elkülönülése. Mérhető

tulajdonságok például a homogenitás, a véletlenszerűség.

- 19 -

A textúra mérésre gyakran használt technika a GLCM mátrixon (Grey Level Co-

occurence Matrix) alapuló mértékek használata. A GLCM-nek magyar elnevezése

nincs, szabadfordításban: szürkeárnyalatok együttváltozása (mátrix).

Nevével ellentétben bármely egész értékekből álló spektrális sávban számítható,

de a valamely sávhoz számított mátrix független a többi sáv értékétől. A GLCM mátrix

négyzetes, sor és oszlopszáma az adott sáv radiometriai felbontásával (kvantálási

szintek száma) egyezik meg. Legegyszerűbb esetben a mátrix (i, j) értékét úgy kapjuk

meg, hogy a szomszédos i-j képpont-párokat összeszámláljuk. Szomszédosság helyett

megadható egy pozitív egész d távolság, ekkor i és j képpontok távolsága d. Négy

irányban számolható GLCM mátrix: 0°, 45°, 90°, és 135°, azaz (i, j) esetben az i

képponthoz képest melyik szomszédos pixel (d > 1 esetben irány) adja a j pozíciót. A

párok összeszámlálása után a mátrixot a transzponáltjával összeadva szimmetrikussá

tesszük, majd az elemszámmal normalizáljuk.

6. ábra: a GLCM mátrix meghatározása

A GLCM mátrixból származtatható statisztikák jellemzik a textúrát. A statisztikák

a következők, ahol Pij a normalizált szimmetrikus GLCM mátrix (i, j) eleme, n a mátrix

sor vagy oszlopszáma:

Entrópia:

∑−

=

−1

0,

)ln(n

jijiij PP

a textúra rendezetlenségét, véletlenszerűségét méri.

- 20 -

Kontraszt:

∑−

=

−1

0,

2)(n

jiij jiP

a lokális különbségeket méri.

Homogenitás:

∑−

= −+

1

0,2)(1

n

ji

ij

ji

P

az elemek eloszlásának közelsége a GLCM főátlóbeli elemekhez. A homogenitás értéke

magas, ha a mátrixbeli értékes (nem nulla) elemek a főátló környezetében

csoportosulnak.

Korreláció: a szomszédos pixelek lineáris függősége. Képlete:

∑−

=

−−1

0,2

))((n

ji

ij jiP

σµµ

ahol µ a GLCM mátrixelemek átlaga, σ2 pedig a szórásnégyzete.

GLCM-alapú texturális mértékeket használhatunk a később bemutatásra kerülő

Definiens eCognition objektumalapú képfeldolgozó rendszerben is.

4. 2. Szegmensalapú osztályozás

Szegmensalapú osztályozás során bevezetünk egy, a pixeleknél nagyobb képi

egységet, a szemgenst. Röviden definiálva a szegmens: spektrálisan hasonló,

szomszédos képpontok egybefüggő halmaza. Természetesen egy felszínborítási

objektum több szegmensből is állhat. A szegmensek létrehozása az osztályozási

folyamat első lépése lesz, ennek eredménye a szegmenstérkép. Az osztályozás a

létrehozott szegmenseket sorolja be a tematikus kategóriákba. A szegmensalapú

osztályozás pontosabb lehet a pixel-alapúnál, ugyanakkor a paraméterezésre nagyon

érzékeny, továbbá a határpontok besorolásakor nem elég pontos, ez az eredmény

pixelenkénti felülvizsgálatával javítható.

- 21 -

A szegmentálás feladata tehát a kritériumoknak megfelelő szomszédos pixelek

összevonása. A szegmentálásnak többféle megközelítése létezik, ezek kombinálva is

alkalmazhatóak.

4. 3. Objektum alapú képelemzés

Az objektum alapú képelemzés (röviden OBIA – Object Based Image Analysis)

új megközelítés a képfeldolgozásban. Az objektum orientált paradigmához bár részben

kapcsolódik, a módszert objektum alapú (és nem objektum orientált) elnevezéssel

szokás jelölni. Az OBIA a pixel-alapú kiértékelés már ismertetett hiányosságainak és

korlátainak leküzdése érdekében, illetve a távérzékelt felvételek korábban ki nem

használt lehetőségeinek kiaknázása céljából alakult ki.

Említettem már, hogy a vizuális interpoláció, az emberi szem és agy a

képfeldolgozás egyes műveleteiben hatékonyabb a számítógépes feldolgozásnál. Az

emberi látás a geometriai összefüggéseket és textúrákat jóval hatékonyabban ismeri és

dolgozza fel, mint a számítógépes látás, mely minden egyes képpontot külön-külön,

vagy néhány pixeles környezetben értelmez. A képelemzés objektum alapú

megközelítésének célja az emberi látás hatékony modellezése, a számítógépi látás

gyorsaságát és mérési pontosságát kihasználva. Azonban meg kell említeni, hogy a

vizuális interpretáció eredménye sem mindig egyértelmű, így annak modellezése sem

zárja ki a hibák lehetőségét.

Míg a pixelalapú képelemzés az egyes képpontok által hordozott információkon

alapul, az objektumalapú elemzés egysége a képi objektum - hasonló képpontok

halmaza. Az objektumok lehetővé teszik a már említett geometriai és texturális

jellegzetességek mérését, alkalmazását az osztályozásban. Továbbá az objektumok

között kialakítható hierarchikus rendszer, felbonthatók al-objektumokra, összefoghatók

szuper-objektumba. Az osztályozásban e hierarchia is szerepet kaphat, illetve ha például

a felvétel egyes objektumai az elemzési feladat szempontjából érdektelenek, ezen

objektumok egy szuper-objektumba szervezve csökkentik a feldolgozandó

adatmennyiséget, erre a gyakorlati alkalmazásokban is láthatunk majd példát. A

geometriai jellemzők alkalmazásával azonos kategórián belüli alosztályokat

- 22 -

különböztethetünk meg, például vízfelületeket tó és folyó alkategóriákba sorolhatunk

(önmagában ez a döntés természetesen hibákat is eredményezhet), illetve minimális

objektumméret meghatározásával kiküszöbölhetők a lokális inhomogenitások okozta

téves osztályozások. Az objektum alapú elemzés eredménye vektoros formátumban áll

rendelkezésre, így térinformatikai rendszerekbe könnyen beilleszthető. Megemlítendő

ugyanakkor, hogy az OBIA nem egzakt módszer, a felkínált lehetőségek nehézségeket

is okozhatnak. A kívánt eredmény eléréséhez hosszadalmas paraméterezésre, tesztelésre

van szükség, továbbá ahogy ezt a későbbiekben bemutatom, a szuperfelbontású

felvételeken tapasztalható egyedi jelenségek miatt a kidolgozott osztályozó folyamatok

automatizálása nehezen megvalósítható.

Objektum alapú képelemzéshez szükségünk van objektumokra, melyek nem

állnak rendelkezésre, mint a felvételből a pixelértékekhez hasonló módon kinyerhető

adatok, azaz elő kell állítani őket. Az objektumok létrehozásának egyszerű módja a kép

szegmentálása. Így értelemszerűen egy felvétel objektumairól nem adható egzakt leírás,

hiszen a szegmentálás, és így az eredmény a feladat függvényében nagyon széleskörű

lehet, akár egyazon felvétel esetében is. A szegmentálás a felhasználható attribútumok

alkalmazhatóságát, az osztályozás eredményét jelentősen befolyásoló kulcslépés az

elemzésben. Az osztályozás elve megegyezik a képpont alapú osztályozáséval, az egyes

objektumokat a tulajdonságai alapján statisztikai döntésekkel valamely osztályba

soroljuk.

- 23 -

5. Szegmentáló eljárások

A szegmentálás alapgondolata és fontos alapfogalmai után a szegmentálás

végrehajtásának módjait mutatom be. Az algoritmusok felépítése mind a technika

(matematikai háttér), mind a felhasznált segédeszközök (pl. adatszerkezetek) igen

sokszínű. Értelemszerűen a kapott szegmenstérkép is sokféle lehet, ugyanakkor az

eltérő módszerek megfelelően paraméterezve hasonló eredményt adhatnak.

Megjegyzendő, hogy a szegmentálásnak nincs egzakt jó eredménye, az eredmény

minőségét a cél és a feldolgozandó felvétel adta lehetőségek határozzák meg.

5. 1. A szegmentáló eljárások áttekintése

A következőkben a szegmentáló algoritmusok három jelentősen eltérő

megközelítését mutatom be. A hisztogram és él alapú módszerek a digitális

képfeldolgozás más területein alkalmazott műveleteinek átfogalmazása, a módszerektől

várható eredmény távérzékelt felvételek szegmentálására nem megfelelő, ugyanakkor a

szegmentálás nem csak távérzékelt felvételek feldolgozására alkalmazható (hanem pl.

orvosi képelemzés), ezért röviden ezeket is bemutatom. A távérzékelés számára

megfelelő szegmentálást a harmadikként bemutatandó régió alapú módszerek adják. A

gyakorlatban alkalmazott szegmentálás általában az itt leírt algoritmusokból felépített

komplex eljárás.

5. 1. 1. Hisztogram alapú szegmentálás

A hisztogram alapú szegmentálás elve nagyon egyszerű, ugyanakkor a kapott

eredmény nem felel meg a szegmenstől definíció szerint várt fontos követelménynek, a

térbeli összefüggőségnek. Ettől a követelménytől távérzékelt felvételeknél,

térinformatikai alkalmazásokban nem tekinthetünk el, de például orvosi célú

képfeldolgozásban alkalmazható a hisztogram alapú szegmentálás. A módszer a

digitális képelemzésből ismert küszöbölés eljárását alkalmazza valamely spektrális

sávokra, statisztikai úton meghatároz egy vagy több küszöbértéket, melyek mentén a

- 24 -

felvételt több részre vágja (az egydimenziós intenzitástérben), a hasonló intenzitású

képpontok ugyanabba a kategóriába kerülnek. Alkalmazható globálisan, az egész képre,

vagy lokálisan, az egyes képrészletekre egymástól függetlenül végrehajtva. A cél lehet

egy küszöbérték meghatározása, ez a felvételezett objektum és a háttér szétválasztását

jelenti, és létezik többszintű, több határértéket meghatározó küszöbölés is. Az eredmény

„jóságát” a hisztogram alakja befolyásolja, értelmes küszöböléshez a hisztogramban jól

elkülönülő lokális maximumok szükségesek, ekkor az optimális érték e maximumok

közötti minimumhely.

Az egyik leggyakrabban alkalmazott módszer az Otsu-féle küszöbölés. Az eljárás

megfelelő alakú hisztogram mellett optimális eredményt ad, azaz a kapott küszöbnél

maximális a két osztály különbsége. Általában szürkeárnyalatos képeken alkalmazzuk,

de bármely spektrális sáv küszöbölhető ily módon. Első lépésben legyen P(i) a sáv (az

összes képpont számával) normalizált hisztogramja. Ennek átlaga és szórásnégyzete:

∑=

=max

0

)(G

i

iiPµ ∑=

−=max

0

22 )()(G

i

iPi µσ

ahol Gmax a lehetséges maximális intenzitásérték. A t küszöb két részre osztja a

hisztogramot, melyekre:

∑=

=t

i

iiPtq 01

1 )()(

1µ ∑=

−=t

i

iPitq 0

21

1

21 )()(

)(1 µσ

∑+=

=max

122 )(

)(

1 G

ti

iiPtq

µ ∑+=

−=max

1

22

2

22 )()(

)(1 G

ti

iPitq

µσ

ahol

∑=

=t

i

iPtq0

1 )()( ∑+=

=max

12 )()(

G

ti

iPtq 1)()( 21 =+ tqtq

Adott t érték mellett az osztályon belüli (2Wσ ) és az osztályok közötti (2Bσ )

szórásnégyzet:

)()()()()( 222

211

2 ttqttqtW σσσ +=

)()( 222 tt WB σσσ −=

Mivel a két szórásnégyzet összege konstans, ezért két ekvivalens lehetőség adott: az

optimális küszöb az a t érték, melyre )(2 tWσ minimális vagy )(2 tBσ maximális. Az

Otsu-eljárás általánosítható többszintű küszöbölésre.

- 25 -

5. 1. 2. Él alapú szegmentálás

A módszer a homogén területeket elválasztó élek alapján építi fel a szegmenseket.

Képi élnek a hirtelen intenzitás-változásokat tekintjük, azaz a szegmenshatárokat ezek

az intenzitásváltozások adják. Éldetektáláshoz használhatjuk a képanalízisben

alkalmazott Prewitt, Sobel, Canny, Laplace konvolúciós szűrőket (a Laplace-szűrő, bár

éldetektor, zajérzékenysége miatt nem alkalmazható távérzékelt felvételeken).

Az éldetektálás gyors művelet, megfelelően paraméterezve a kapott

szegmenshatárok jól követik az objektumok határait, ugyanakkor nincs lehetőség

geometriai kritériumok alkalmazására, a keletkező szegmensek számát, méretét nem

tudjuk kontrollálni.

Szuperfelbontású felvételeken lokális inhomogenitások, a domborzati és a fény-

árnyék viszonyok is okozhatnak nagy intenzitásváltozásokat, emiatt a módszer ezen

felvételekre nem alkalmazható.

A gradiens alapú éldetektor az egyes képpontok közvetlen környezetében méri az

intenzitásváltozást. A szomszédos képpontok intenzitásbeli különbsége a gradiens. A

digitális képet, mint f(x,y) kétváltozós függvényt tekintve az (x,y) pontbeli gradiens:

∂∂

∂∂=∇ ),(),,(),( yx

y

fyx

x

fyxf

ahol x

f

∂∂

, x

f

∂∂

a pixelérték első deriváltjai. A gradiens alapú éldetektálás a gradiens

diszkrét közelítése, a felvételen az operátor az intenzitásváltozásokat kiemeli (a változás

nagyságának függvényében), a homogén területeket elnyomja. A művelet eredményét

éltérképnek nevezzük.

A Sobel és a Prewitt szűrő ugyanazon elven működik, a felvétel minden

képpontját konvolválja egy adott magfüggvénnyel.

A Sobel-magfüggvények:

- 26 -

x

f

∂∂

:

−−−

101

202

101

és y

f

∂∂

:

−−

121

000

121

,

a Prewitt-magfüggvények:

x

f

∂∂

:

−−−

101

101

101

és y

f

∂∂

:

−−−

111

000

111

.

A két irány menti konvolúció eredményét összefuttatva kapjuk az éltérképet.

A Laplace szűrő a második deriváltak diszkrét közelítését alkalmazza:

fy

f

x

fyxfyxg

∂∂+

∂∂=∆= 2

2

2

2

),(),(

a konvolúcióban alkalmazott magfüggvény:

−−−

−

010

141

010

A második deriváltak miatt a Laplace operátor zajérzékeny, ezért önmagában csak

mesterséges képekre alkalmazható. Gauss-simítással kombinálva alkalmas természetes

képek szűrésére is, ez az ún. LoG (Laplacian of Gaussian) szűrő.

5. 1. 3. Régió-alapú szegmentálás

Alapvetően kétféle régió-alapú szegmentálási módszert alkalmazunk. A

módszerek iteratívak, minden lépésben a pillanatnyi állapotra alkalmazzák a műveletet.

Az összevonás-alapú módszerek az eljárás első lépésében minden képpontot önálló

szegmensnek tekintenek, és meghatározott módon, iterációs lépésekben a feltételeknek

megfelelő szomszédos elemeket összevonják. A vágás-alapú szegmentáló eljárások első

lépésben az egész felvételt egy szegmensnek tekintik, iterációs lépésekben a

szegmenseket kisebb elemekre felbontja. A szakirodalom számos régió-alapú

szegmentáló módszert ismer. Természetesen az alkalmazott eljárás lehet összetett,

ahogy az a később bemutatott gyakorlati példákban is látható. A képpont-alapú

- 27 -

eljárások mellett a szegmentálásnak létezik gráfelméleti megközelítése is. Az

algoritmusokban alkalmazható adatszerkezetről a Függelékben írok röviden.

5. 1. 4. A szegmentálás, mint gráfelméleti probléma

A kép reprezentálható irányítatlan gráffal, a következő módon. Az irányítatlan

gráf egy G = (V, E, ω) hármas, V a csúcsok, VVE ×∈ az élek halmaza, →∈ Eω ℝ

súlyfüggvény. A reprezentáláshoz rácsgráfot használunk, ahol a képpontok a gráf

csúcsai, az élek súlyozása a szomszédos pixelek viszonya alapján történik.

A gráfban a szegmenseket összefüggő részgráfokkal írhatjuk le. Mind az

összevonás, mind a vágás-alapú szegmentálás megoldható gráfelméleti úton. A vágás a

csúcshalmaz diszjunkt részhalmazokra bontását jelenti. Ekkor csak azok az élek

maradnak meg, melyek az egyes szegmenseken belüli pontokat kötik össze.

Az eljárások az összevonást illetve vágást iteratívan ismétlik, valamilyen

terminálási feltétel teljesüléséig. Ez lehet a szegmensek száma, további összevonási,

vágási lehetőségek hiánya, vagy fix lépésszám is.

5. 2. Összevonás-alapú szegmentálás

Az összevonás-alapú szegmentálás alulról felfelé építkező folyamat. Első

lépésben minden képpont (vagy meghatározott méretű cella) önálló szegmens. A

szomszédos elemek összevonása adott homogenitási kritérium teljesülése esetén

történik meg. A homogenitási kritérium mellett minimális méretet is előírhatunk a

kapott szegmenseknek. Ilyenkor a kritérium alapján össze nem vonható szegmens a

legkevésbé különböző szomszédhoz csatolható.

5. 2. 1. Szekvenciális csatolás

A pixel-alapú módszer 2x2-es cellákra osztja a képet, majd az egyes cellákról

eldönti, hogy homogénnek tekinthető-e. A 2x2-es felosztás helyett más, kettő-hatvány

- 28 -

méretű kezdeti cellaméret is alkalmazható. A homogenitási kritériumot a cellában az

egyes sávok átlagának és szórásának különbsége adja, a következő egyenlőtlenségben

látható módon:

H

n

i

i Cxn

xx≤

−−

∑=1

2

2

)1(

)(

ahol n a cella pixelszáma, jelen esetben 4. Az inhomogén cellákat nem soroljuk

szegmensbe, a homogén cellákkal egy területnövelő algoritmust hajtunk végre. Ez

szekvenciálisan, felülről lefelé és balról jobbra haladva a homogén cellákat valamelyik

(a legközelebbi) szomszédos szegmenshez próbálja sorolni. Ha nem lehetséges

összevonás, a cella egy új szegmens kezdete lesz.

Az összevonás lehetőségét a szegmensekhez tartozó intenzitások átlaga és szórása

által meghatározott ANOVA-kritériumok döntik el. Legyen x és y a vizsgált szegmens

elemei (x m elemű, y n elemű minta), z az összevonással kapott minta. Minden sávban

kiszámoljuk az

∑=

−=m

iix xxA

1

2)( ∑=

−=n

iiy yyA

1

2)(

∑=

−=m

iix zxB

1

2)( ∑=

−=n

iiy zyB

1

2)(

értékeket.

Ezután legyen yx AAA += és yx BBB += . A szegmensek összevonhatók, ha az alábbi

egyenlőtlenségek minden sávra teljesülnek:

12/)()/( CBA nm ≥+

2

2/1

2

11

))/((

)/()/(C

nmA

nAmAnm

ny

mx ≥

+ −+

−−

meghatározott C1 és C2 értékekre.

Az eljárás eredménye egy szegmenstérkép, melyen egy szegmens várhatóan egy

felszínborítási egységhez tartozik, de természetesen egy felszínborításhoz több

szegmens is tartozhat. Az algoritmus műveletigénye Ο(n), azaz lineáris a képpontok

számának függvényében.

- 29 -

5. 2. 2. Legjobb összevonás

Az eljárás első lépésben minden képpontot önálló szegmensnek tekint. A vizsgált

szegmenst a hasonlósági kritériumnak legjobban megfelelő szomszéddal (esetleg

szomszédokkal) összevonja. Az algoritmus iteratív, többször bejárja a képet, leállási

feltétele egy adott szegmensszám elérése, vagy további összevonások lehetőségének

hiánya lehet. Első megközelítésben az algoritmus sorrendfüggő, azaz előfordulhat, hogy

egy az A és a B szegmenssel is szomszédos C szegmens az A-val kerül összevonásra, ha

az A-t vizsgáljuk előbb, B-vel, ha a B-t vizsgáljuk előbb, ugyanakkor A-C-B szegmens

már nem keletkezik. A sorrend-függőség elkerülésére ideális megoldás, hogy minden

iterációban csak egy összevonás történik, majd újraszámoljuk minden szomszédos

szegmens-pár hasonlóságát.

Az eredményt befolyásolja a hasonlósági (különbözési) kritérium és a leállási

feltétel megválasztása. A következőkben két kritériumot mutatok be:

Tilton kritérium:

Tilton kritériuma az átlagos négyzetes eltérés megváltozásának minimalizálásán

alapul. Valamely spektrális sávra az átlagos négyzetes eltérést (MSE – Mean Square

Error) a következő várható értékkel definiáljuk:

[ ] ∑=

−−

≅−=N

p

rpp

r PPN

PPEMSE1

22 )(1

1)(

ahol P az eredeti érték, Pr a régió átlaga, N a felvétel képpont-száma. A sáv

szórásnégyzetével normalizálva:

2σMSE

NMSE=

Vizsgáljuk az átlagos négyzetes eltérés megváltozását két szegmens összevonása után:

2σMSEMSE

NMSEc −=∆

ahol MSE az összevonás előtti, MSEc a az összevonás utáni érték. Több sáv alapján

végzett szegmentálásnál minimalizálandó a sávonként kiszámolt ∆NMSE értékek átlaga,

összege, vagy maximuma. A minimumot adó két szegmens összevonása jelenti a

legjobb összevonást.

- 30 -

Beaulieu és Goldberg kritérium:

Legyen f(x,y) a felvétel, mint kétváltozós függvény, és S1, S2, … Sn a felvétel

szegmensei. Ekkor fi(x,y) az Si szegmens képpont-értékeit jelenti. Legyen továbbá r i(x,y)

az f(x,y) polinomiális közelítése. Ekkor a szegmensbeli közelítés hibája az i.

szegmensben:

∑∈

−=iSyx

ii yxryxfSH),(

2)),(),(()(

Minimalizálandó ennek a hibának a megváltozása (növekedése) két szegmens

összevonásakor, azaz a feladat megtalálni azt a szegmenspárt, melyek összevonása a

legkisebb növekedést eredményezi. A kritérium felírható a következő módon:

)()()( jijiij SHSHSSHC −−∪=

.

A legjobb összevonás műveletigénye legrosszabb esetben négyzetes (Ο(n2)),

optimalizálva, megfelelő adatszerkezeteket használva Ο(n·logn) lehet.

5. 2. 3. Gráf alapú összevonás

A korábban említett rácsgráfban az első lépésben minden képpont önálló

szegmens. A szegmenseket heterogenitásukkal jellemezzük, ami az egyes szegmenseket

reprezentáló részgráfok feszítőfájában a maximális él súlya, legyen ez az S

szegmensben het(S). A szomszédos S1 és S2 szegmens összevonható, ha ez nem

változtatja meg jelentősen a heterogenitást, azaz ha a következő egyenlőtlenség teljesül:

)()(,)(min 212

21

1 SShetS

kShet

S

kShet ∪>

++

ahol k alkalmas küszöbérték, ennek és a szegmens elemszámának hányadosa arányos

korrekciós tényező.

Első lépésben az eljárás minden élt megvizsgál a súlyok növekvő sorrendjében, és

lehetőség szerint összevon részgráfokat. A rendezettség miatt az az él, amely mentén

összevonás történik, az új szegmensben a minimális feszítőfa maximális éle lesz, így a

feszítőfát nem kell meghatározni. Az algoritmus futási idejét a rendezés határozza meg,

megfelelő adatszerkezetet alkalmazva Ο(n·logn) hatékonyságú.

- 31 -

5. 3. Vágás-alapú szegmentálás

A vágás-alapú szegmentálás felülről lefelé építkező módszer, első lépésében a

teljes felvétel egy szegmens, melyet a kritériumok alapján minden lépésben több részre

bont. A bemutatott algoritmusok mind gráf-alapúak, ugyanakkor a hisztogram-alapú

eljárás alapgondolata is felhasználható, ahogy azt az eCogniution programrendszer

kínálta egyik szegmentálásnál (contrast split segmentation) ezt látni is fogjuk.

5. 3. 1. Minimális átlagsúly alapú vágás

Az algoritmus gráf alapú, az élsúlyokat hasonlóság függvény adja, azaz a kisebb

élsúly nagyobb intenzitáskülönbséget jelent a szomszédos képpontok között. A vágás

minimális átlagsúlyú élhalmaz mentén történik, zárt vágásokat is megengedve.

A vágás egy lépésben a G gráfot két diszjunkt (G1 és G2) részgráfra vágja. A

legegyszerűbb súlyfüggvény a két részgráfot összekötő élek súlyának összege:

∑∈∈∈ EvuGvGu

vu),(,, 21

),(ω

Minimális vágás az, melyre a súlyfüggvény az összes lehetséges vágás közül a

legkisebb értéket adja. Az eljárást így az élhalmazok mérete is befolyásolja, ezt

elkerülendő az összeget a vágásban szereplő élek számával normáljuk:

∑∑

1

),( vuω

Az így definiált eljárás nem alkalmazható a gyakorlatban, ugyanis a minimális

átlagsúlyú élhalmaz megtalálása az általános gráfok körében NP-nehéz, azaz

polinomiális időben nem megoldható. Ugyanakkor a probléma áttranszformálható oly

formára, melyre létezik polinomiális idejű algoritmus.

Első lépésben minimális átlagsúlyú vágás helyett minimális átlagsúlyú egyszerű

kört keresünk. Az egyszerű kör feltétel azt jelenti, hogy a körben minden elem egyszer

szerepel. Ez a lépés egy gráf-transzformáció, az új gráf elnevezése duális gráf:

GD = (VD, ED, ωD).

- 32 -

GD duális gráf előállítása:

1. Minden G-beli rácshoz rendelünk egy pontot a duális gráfban, amely a

rács közepére kerül.

2. Létrehozunk egy segédcsúcsot.

3. Minden Ee∈ élnek megfeleltetünk egy ugyanakkora költségű

DD Ee ∈ duális élt. A duális gráf határoló csúcsaiból a segédcsúcsba futnak

az eredeti gráf határoló éleinek megfelelő duális élek.

Ebben a GD gráfban keresünk minimális átlagsúlyú egyszerű kört. A kapott

élhalmaznak megfelelő élek halmaza az eredeti gráfban lehet kör, így zárt vágást, vagy

két szélső élt is tartalmazó halmaz, így nyílt vágást kapunk.

Minimális átlagsúlyú kör keresése irányítatlan gráfban ugyanúgy NP-nehéz, de

irányított gráfon már megoldható polinomiális időben, ezért egy újabb transzformációra

van szükség. Következő lépésben minden él súlyát csökkentjük úgy, hogy a keletkező

gráfban legyen pontosan egy negatív kör. A megfelelő értéket a legkisebb és

legnagyobb élsúlyból indított logaritmikus kereséssel határozhatjuk meg, szükség esetén

megfelelő leállási feltételt adva a keresésnek.

A polinomiális időben való megoldhatósághoz még egy transzformációra van

szükség, hogy az előálló gráfra alkalmazható legyen a tökéletes illesztés feladata. A

tökéletes illesztés olyan részgráf előállítása, mely tartalmazza az összes csúcsot, és

minden csúcshoz pontosan egy élt a teljes gráfból. E részgráfok közül kell

kiválasztanunk a minimális átlagsúlyút. Ehhez a negatív kört tartalmazó duálisból elő

kell állítani a GM = (VM, EM, ωM) gráfot. Első lépésben minden GD-beli u csúcshoz

rendelünk egy u1 és u2 csúcsot, és az ezeket összekötő nulla súlyú élt. Majd minden

DEvu ∈),( élhez további két csúcsot rendelünk, ezek jelölése uv és vu. Az uv és vu

csúcsokat 0 súlyú éllel kötjük össze, továbbá éleket rendelünk az uv - u1, uv - u2, vu - v1,

és vu - v2 csúcsok közé, ezek súlya ωD(u,v)/2. A GM gráfban keresünk negatív tökéletes

illesztést, ami egyben a gráf minimális tökéletes illesztése. Ez a feladat Ο(n2·m) időben

megoldható, ahol n a csúcsok, m az élek száma.

- 33 -

Természetesen ez a művelet egy vágást hajt végre, két szegmenst létrehozva. A

keletkező szegmensekre a vágást - a teljes leírt folyamatot - iteratívan végrehajtva,

leállási feltételeket előírva kapjuk a kép egy szegmentálását.

A módszer érzékeny a képzajokra, a környezettől önmagukban eltérő képpontokat

önálló szegmensbe sorolja be. További probléma, hogy bizonyos esetekben hamis

vágást is végrehajthat, ami felesleges szegmensek létrejöttét jelenti. A zajokból

származó szegmensek okozta problémákat megoldhatja egy, a szegmentálás után

alkalmazott keresés, amely egy adott korlátnál kisebb képpont-számú szegmenseket a

hozzá legjobban hasonló szomszédjához csatolja.

5. 3. 2. Minimális arány alapú vágás

Az arány alapú vágás a minimális átlagsúly-alapú vágás egy továbbfejlesztett

változata. Az eljárásban két súlyfüggvényt használunk, ω1-t és ω2-t, ω2 bármeny élre

csak pozitív értékű lehet. A súlyok aránya ω1/ω2. Vezessük még be a határköltség

(ci(A,B)) és a körköltség (ci(C)) függvényeket a következő módon:

∑∈∈∈

=EvuBvAu

vuBAc),(,,11 ),(),( ω

∑∈

=Cvu

vuCc),(

11 ),()( ω

∑∈∈∈

=EvuBvAu

vuBAc),(,,22 ),(),( ω

∑∈

=Cvu

vuCc),(

22 ),()( ω

A határköltség az A és B részgráfok közötti összefüggés erejét adja meg, ezt a

második költséggel normalizáljuk, így a részgráfok közötti arány c1(A,B)/c2(A,B). Ez a

minimális átlagsúly-alapú vágás súlyfüggvényének általánosítása, ha minden

Evu ∈),( -re ω2(u,v)=1, akkor megegyezik vele, azaz a probléma a korábban leírt

transzformációk után oldható meg polinomiális időben.

- 34 -

Az algoritmus régiókra (például egy szegmentálás eredménye) is alkalmazható,

ekkor teljes tartományok szintjén történik a vizsgálat, ugyanakkor a régióalapú gráf nem

feltétlenül rácsgráf. Régióalapú vágással korrigálhatóak a hamis vágások.

5. 3. 3. Normált minimális vágás

A minimális átlagsúly alapú vágás súlyfüggvényét itt is alkalmazzuk:

∑∈∈∈ EvuBvAu

vu),(,,

),(ω

A normalizálás figyelembe veszi a vágás méretét, az osztás a szegmensből kivezető élek

súlyának összegével történik, azaz a vágófüggvény:

∑

∑

∑

∑

∈∈

∈∈

∈∈

∈∈ +=

GtBv

BvAu

GtAu

BvAu

tv

vu

tu

vu

BANcut

,

,

,

,

),(

),(

),(

),(

),(ω

ω

ω

ω

Ahol a nevezők szokásos jelölése assoc(A,G) illetve assoc(B,G). Az optimális vágást az

Ncut(A,B) minimalizálásával kaphatjuk meg. Ez NP-nehéz probléma, ugyanakkor a

valós számok körében jó közelítés adható rá.

Legyen D diagonális mátrix, melynek i. eleme:

∑∈

=Gj

ii jid ),(ω

azaz az i. csúcsba vezető élek súlyának összege, továbbá W a gráf súlymátrixa, azaz:

),( jiWij ω=

Továbbá legyen x indikátorvektor, azaz xi = 1, ha az i. csúcs az A részgráfban van,

különben xi = -1, és y = (1 + x) - b(1 - x), ahol:

k

kb

−=

1

és

∑

∑>=

ii

xi

d

d

k i 0

Ekkor a minimalizálás felírható, mint:

- 35 -

Dyy

yWDyxNcut T

T

yx

)(min)(min

−=

ami a Rayleigh hányados. Tovább egyszerűsítve a minimalizálás a következő sajátérték-

egyenlet:

DyyWD λ=− )(

Az eljárás rekurzív módon működik. Egy gráfról minimális vágást alkalmazva

eldönthető, hogy egy szegmest alkot-e. Amennyiben vágni kell, a normált vágással két

részgráfot hozunk létre, majd a keletkező részgráfokra alkalmazzuk az eljárást. A

rekurzió bizonyíthatóan optimálisan terminál, a vágásoknak polinomiális idejű

megvalósítása ismert. A normált vágás a sajátérték-egyenlet megoldása jelenti, például

Lanczos-módszerrel.

- 36 -

6. Gyakorlati feladatok megoldása a Definiens eCognition programrendszerrel

Az eddigiekben leírt elméleti háttér után rátérek a szegmentálás gyakorlati

alkalmazásának bemutatására. Az alkalmazások megvalósítása egy objektum alapú

képfeldolgozó programrendszerben történt. Megjegyzendő, hogy a programrendszer

kínálta szegmentáló eljárások nem az elméleti részben tárgyalt algoritmusok

tükörfordításai, hanem azokból összetett komplex módszerek. Kereskedelmi program

lévén az algoritmusok forráskódja nem áll rendelkezésre, de a hozzá tartozó leírás

(Reference Book) elég részletet árul el az eljárások elméleti hátteréről.

6. 1. Gyakorlati alkalmazások

A szegmentálás és az objektum alapú képelemzés gyakorlati alkalmazásaiból

mutatok be néhány példát. Ezeket a feladatokat a Földmérési és Távérzékelési

Intézetben (FÖMI) dolgoztam fel. Minden alkalmazás a FÖMI egy-egy fontos

feladatához kapcsolódik, ugyanakkor az általam alkalmazott objektum alapú technikát

ezen feladatkörökben az intézet korábban nem alkalmazta, bár kutatás-fejlesztés a

szegmentálás témakörében régóta zajlik a FÖMI és az ELTE IK Algoritmusok és

Alkalmazásai tanszék közös munkájában.

Végzett munkám célja nem a bevett módszerek kiváltása, de lehetőséget ad azok

más szemszögből történő értékelésére, összehasonlításra, illetve megvizsgálhatjuk az

OBIA módszerek későbbi operatív alkalmazásának lehetőségét is.

Az elemzéseket a Definiens eCognition 8.0 objektum alapú képfeldolgozó

programrendszerben végeztem. A feladatok bemenő adata ortofotó, illetve

szuperfelbontású űrfelvétel, elsődleges eredménye egy vektoros formátumú tematikus

térkép, azaz ún. shapefile, mely alkalmas további feldolgozásra térinformatikai

rendszerekben. Az elemzendő adatokat előfeldolgozott formában kaptam meg. A

feldolgozási folyamat első lépése egy, a kitűzött célnak lehető legjobban megfelelő

- 37 -

szegmentálás kidolgozása. A programrendszer számos, a bemutatott algoritmusokból

felépített eljárást kínál, a feladathoz alkalmas lépések kiválasztása és paraméterezése a

szegmentálás elméletének ismerete mellett fotogrammetriai ismereteket is igényel, a

paraméterezés finomhangolása kísérletezés, tesztelés útján történt. Mindemellett a

szegmentálás eredményének értékelésekor az alkalmazott felvétel korlátait is

figyelembe kell vennünk. A szegmentálás után a kapott objektumok osztályozása

következik. Az osztályozás a feladat nehézségének függvényében több lépésből állhat,

az objektum alapú elemzés lehetőségeire erősen támaszkodva. Az osztályozás alapja

kijelölt tanulóterületeken történő mintavételezés. A tanulóterületek kijelölése egyes

feladatokban a felvétel vizuális áttekintése alapján, a parlagfű-detektálás alkalmazásban

terepi felmérés adatai alapján történt. A szegmentáláshoz hasonlóan az osztályozás

pontosítása is kísérletezés és tesztelés útján, az egyes tematikus kategóriákat leíró

valószínűségi görbék módosításával történt.

Először röviden bemutatom a használt programrendszert, majd az egyes

alkalmazások fejlesztési folyamatát és eredményeit. Természetesen jóval szélesebb körű

mind a objektum alapú elemzés, mind a konkrét programrendszer alkalmazási

lehetősége. Célszerű lenne a mikrohullámú távérzékelt felvételek (RADAR) objektum

alapú elemzési lehetőségének vizsgálata, az eCognition erre alkalmas, ugyanakkor a

mikrohullámú technika elméleti háttere nem része dolgozatomnak, ezért e téren

gyakorlati alkalmazást nem ismertetek.

6. 2. A Definiens eCognition programrendszerről

A Definiens eCognition egy objektum alapú képelemző programrendszer,

elsősorban távérzékelt illetve orvosi felvételek feldolgozására kifejlesztve. Kifejlesztője

a müncheni illetőségű Definiens AG. A FÖMI-ben a 8.0-ás verzió érhető el. A rendszer

három modulból áll, melyekből a feladatokban az elemző környezetet biztosító

eCognition Developer és a kötegelt feldolgozást vezérlő eCognition Server kap

szerepet.

A felvételek egyes sávjai a programban képrétegekként jelennek meg. A képi

információ legalsó szintje a képréteg. A kép megjelenítésére tetszőleges sáv-színpuska

- 38 -

kombináció választható, a feldolgozást értelemszerűen nem befolyásolja a megjelenített

kompozit. A képi rétegekből tematikus rétegek, illetve rétegműveletekkel további

rétegek, például spektrális indexek hozhatóak létre.

A képi objektumok hierarchikus rendszert alkotnak. A legalsó szint a pixelek

szintje. Az objektumok felépítése e szint alapján történik, ugyanakkor a szinten

végrehajtható műveletek száma erősen korlátozott. Osztályozást, egyes szegmentáló

lépéseket nem lehet pixel-szinten végrehajtani. Az objektumok szintje összetett, további

hierarchikus szintekre bontható.

A képelemző folyamat fejlesztése ún. szabályrendszerek (Rule Set)

megalkotásából áll. A szabályrendszer különböző folyamatokból áll, ezek a

szegmentáló, osztályozó műveletek, morfológiai műveletek, rétegműveletek, exportálás.

A folyamatok két szinten, a pixelek és az objektumok szintjén hajthatnak végre

műveleteket. A művelet kiválasztásával van lehetőség a paraméterek beállítására,

megadhatóak a bemenő rétegek, az eredmény helye (réteg, osztály). Lehetőség van

változók definiálására is.

Megemlítendő a felvétel cserepekre (tiles) osztásának lehetősége. A

feldolgozandó felvételek mérete miatt egyes műveletek erőforrás-igénye gyakran

meghaladja a rendelkezésre álló kapacitást. A szegmentálás nagy memória-igényéről

már volt szó, nagy méretű felvétel szegmentálása csak darabonként történhet. A

cserepek mérete megválasztható. A szegmentálást a cserepeken végrehajtva majd a

cserepeket egyesítve kapjuk a teljes felvétel szegmentálását, az éles határok

megjelenése egy összevonó lépéssel kiküszöbölhető.

A kifejlesztett szabályrendszer végrehajtható a felvétel egy részén vagy egészén,

illetve több felvételen is.

6. 3. Az eCognition szegmentáló eljárásai

A programrendszer többféle feltételű és célú szegmentáló eljárást kínál. Az

eljárások több szinten végrehajthatóak (az esetleges korlátozásokat az egyes

- 39 -

algoritmusoknál megemlítem), a képpontok szintjén az objektumok létrehozása,

objektum-szinten a meglévő szegmentálás finomítása, szegmensek összevonása, vagy

szétvágása lehet cél. Egyes eljárások csupán a feldolgozandó adatmennyiség

csökkentésére szolgálnak, az általuk létrehozott objektumok nem tényleges szegmensek,

ugyanakkor nagyméretű felvételek esetén szükséges a képpontok helyett ezek

alkalmazása a szegmentálás bemenő adataként.

Az algoritmusok változatos paraméterezési lehetőséggel bírnak. Az eljárások

részletezésekor csak a szegmentálás szempontjából érdekes paramétereket említem.

Ezek mellett a kimenő adatokat is befolyásolhatjuk, például a küszöböléssel kapott

szegmenseket osztályokba rendelhetjük. A szegmentálást befolyásoló paraméterek

eljárás-függőek. Kiválaszthatóak a felvétel azon sávjai (képi és számolt sávok

egyaránt), melyek alapján az algoritmus dolgozik, ezek súlyozására is lehetőség van. A

küszöb alapú eljárásokban a küszöbérték meghatározását, a kritérium alapú

eljárásokban a homogenitás mértékét és összetevőit állíthatjuk be a paraméterekkel.

A részletezés során az alkalmazható eljárások és lehetséges paramétereik angol

nyelvű elnevezését használom, ezek magyar fordítása egyértelmű. Az egyes

szegmentálások eredményeit a későbbiekben bemutatásra kerülő „facsoportok

lehatárolása” feladatban is használt színes infravörös légifelvételen szemléltetem, ahol

indokolt, ott többféle paraméterezés mellett.

Chessboard segmentation:

A sakktábla-szegmentálás a képet négyzetekre bontja. Értelmes jelentéssel bíró

objektumok létrehozására nem használható, ugyanakkor további szegmentáló lépések

előkészítésére használhatjuk, elsősorban nagyméretű felvételek feldolgozását

gyorsíthatjuk meg. A képpontok helyett a létrehozott szegmenseket használjuk az

értelmes objektumokat létrehozó algoritmusok bemenő adataként.

Paraméterei: a négyzet kívánt oldalhossza.

- 40 -

7. ábra: sakktábla szegmentálás eredménye 100 pixel oldalhosszal (a színes infravörös felvételek valamint a hamisszínes kompozit

jellemzője a növények vörös színe)

Quadtree segmentation:

A sakktábla-szegmentálás összetettebb változata, a képet négyfa-ráccsal (l.

Függelék) felosztja. A felosztást a méretre adott felső korlát, valamint paraméterezhető

homogenitási kritérium befolyásolja. A homogenitási kritérium alkalmazásával a kapott

objektumok az erős geometriai megkötöttség mellett spektrálisan is összefüggenek. Ezt

az algoritmust is elsősorban nagy felvételeken, a további lépéseket segítendő

alkalmazzuk.

A paraméterek:

Scale: a szegmensen belüli spektrális eltérés maximuma a kiválasztott rétegeken.

Layer weights: a szegmentálás során alkalmazni kívánt rétegek kiválasztása, súlyozása.

- 41 -

8. ábra: négyfa szegmentálás scale=50 és scale=100 paraméterezéssel

Contrast split segmentation:

Az eljárás az objektumokat sötét és világos szegmensekre bontja. Az algoritmus

(a hisztogram alapú szegmentálásnál bemutatott módszerhez hasonlóan) minden

objektumra meghatároz egy optimális küszöböt, mely a keletkező világos és sötét

szegmensek közötti kontraszt maximuma. A küszöböt paraméterként megadható

intervallumban keressük Az algoritmus meglévő objektumokat vág fel, pixelszinten

alkalmazva ezért először végrehajt egy sakktábla-szegmentálást, melynek eredménye

adja a vágandó objektumokat.

Paraméterezés:

Chessboard tile size: pixelszinten a kezdeti objektumok mérete

Minimum/maximum threshold: az intervallum, melyben a küszöb meghatározandó.

Step size: a küszöb meghatározásán alkalmazott lépésköz (nagyobb érték-gyorsabb,

kisebb érték-nagyobb kontraszt az objektumok között)

Image layer: az alkalmazott réteg

Contrast mode: a használandó mérték: él-alapú, objektum-alapú

Megadható egy-egy osztály a sötét és világos objektumok számára, változók a küszöb

és a kontraszt számára, minimális objektumméretek.

- 42 -

9. ábra: contrast split szegmentálás a következő paraméterezéssel: chessboard tile size=256, step size=3, contrast mode=object difference

Multiresolution segmentation:

Az algoritmus képpontokat vagy objektumokat von össze, azaz összevonás-alapú.

Optimalizáló módszer, adott objektumszám mellett minimalizálja az átlagos

heterogenitást, és maximalizálja az objektum saját homogenitását. Olyan objektumokat

von össze, melyek kölcsönösen legjobban illeszkednek egymáshoz.

Az algoritmus lépései:

1. kezdő lépésben minden képpont önálló objektum. Ezeket több lépésben nagyobb

objektumokba vonja össze, amíg azok egy adott homogenitási küszöböt el nem

érnek. Ez a küszöb a paraméterben megadható spektrális és alaki homogenitás

értékekből keletkezik.

2. Az így keletkezett minden magobjektumhoz megkeresi a legjobban illeszkedő

szomszédot

3. Ha a legjobban illeszkedés nem kölcsönös, az összehasonlításban szereplő

objektum lesz a következő vizsgált objektum

4. Ha a legjobban illeszkedés kölcsönös, a két objektumot összevonja

- 43 -

5. minden iterációs lépésben minden objektumot egyszer vizsgál

6. Az iteráció leáll, ha nincs további összevonási lehetőség.

Paraméterezés:

Layer weights: a szegmentálás során alkalmazni kívánt rétegek kiválasztása, súlyozása.

Scale parameter: a megengedett maximális heterogenitás egy objektumon belül

Shape: a spektrális és geometriai homogenitás mértéke (color = 1 - shape)

Compactness: az objektumok kompaktságának mértéke

10. ábra: a multiresolution segmentation kritériumának összetétele

- 44 -

11. ábra: multiresolution segmentation color=0,9, scale=50 paraméterek mellett

12. ábra: multiresolution segmentation scale=50 paraméter és nir=2, red=1, green=0 sávsúlyok mellett

- 45 -

13. ábra: multiresolution segmentation scale=10 paraméterek mellett

14. ábra: multiresolution segmentation color=0,1 (shape=0,9), scale=50 paraméterek mellett

Spectral difference segmentation:

Az algoritmus szomszédos objektumokat von össze, amennyiben az átlagos

intenzitásértékeik különbsége a megadott küszöb alatt marad. Szegmentálás

finomítására tervezett algoritmus, képpont szintből objektumok létrehozására nem

használható.

- 46 -

Paraméterezés:

Maximum spectral difference: két összevonandó objektum maximális eltérése.

15. ábra: spectral difference szegmentálás maximum spectral difference=5 paraméter mellett

Multi-threshold segmentation:

Az eljárás az objektumokat felosztja megadott pixel-szintű küszöbértékek alapján.

Megadható tetszőleges számú küszöb, az objektumokat osztályokba is sorolhatjuk.

6. 4. Osztályozás végrehajtása

A szegmentálással létrehozott objektumokon végrehajtható az osztályozás. Ahogy

említettem, az objektum alapú osztályozás menete hasonló a pixel-alapú

osztályozáshoz, ugyanakkor az osztály definiálására jóval szélesebb körű lehetőség

adott. A spektrális átlag és szórás mellett a programrendszer geometriai és texturális

jellegzetességek, valamint az osztályhierarchiában betöltött szerep is megjelenhet az

osztály leírásában. A leírásban megadhatóak küszöbértékek, vagy valószínűségi görbék

az egyes jellegzetességekre. A fix küszöbérték az objektumok osztályhoz való

illesztésében 0 vagy 1 valószínűséggel szerepel. Az osztályhoz tartozást a jellemzők

- 47 -

valószínűségének minimuma dönti el. Abba az osztályba soroljuk az objektumot,

melyre ez a minimum maximális, amennyiben ez legalább 0,1 valószínűséget jelent. Ezt

az osztályozást „classification” eljárással hajthatjuk végre. Az osztályozandó

objektumok köre szűkíthető például korábbi osztályozás kategóriái alapján. A

célosztályok szintén megválaszthatók, az illesztés csak a kiválasztott osztályokra

történik meg.

A „classification” eljárás mellett az „assign class” eljárással lehetőség van

objektumok egy adott osztályba sorolására küszöbértékek megadásával is, ekkor nincs

szükség osztálydefinícióra. Ekkor is megadható az osztályozandó objektumok köre,

valamint egy célosztály. A küszöbértéknek megfelelő objektum a kiválasztott osztályba

kerül, az esetben is, ha az osztályhoz tartozik definíció, amelynek nem felelne meg az

objektum.

Az osztályozás folyamatában bármikor alkalmazható a nem osztályozott

(„unclassified”) kategória is, osztályozott objektumokat visszasorolhatunk nem

osztályozottba. Ennek például akkor van értelme, ha például egyes szomszédos

objektumok egyenként eleget tesznek az osztálydefiníciónak, de összevonva már

kiesnek a kategóriából.

Az osztályozás a jó eredmény érdekében a szegmentáláshoz hasonlóan tesztelést

igényel. Javítás a küszöb vagy a valószínűségi görbe módosításával hajtható végre, ez

utóbbi a tartomány tetszőleges helyén módosítható, ahol az értéke nem 0.

- 48 -

7. Fák lehatárolása (MePAR felújítás)

Az eszköz rövid leírása után rátérek az egyes gyakorlati alkalmazások bemutatására. A

FÖMI egyik legfontosabb, legnagyobb emberi erőforrásokat igénylő feladata a

Mezőgazdasági Parcella Azonosító Rendszer (MePAR) üzemeltetése és folyamatos

felújítása. A MePAR a területalapú támogatások kizárólagos hivatkozási rendszere

(2004-től), melyben minden mezőgazdasági tábla egyértelműen azonosítható és

lekérdezhető. A MePAR EU-szintű feladatai a terület alapú mezőgazdasági

támogatások kezelése a kérelmezéstől a terepi és távérzékeléses ellenőrzésig. A

rendszer alapegysége a fizikai blokk. A blokkok határvonalait jellemzően valamilyen

időben állandó természetes vagy mesterséges terepi objektum, például patak, fasor,

erdőszél, vagy utak, vasút adja. Teljes állandóság azonban ezen objektumoktól sem

várható el, a MePAR-t folyamatosan fel kell újítani. A felújítás egyik alapvető

forrásanyagát a minden évben elvégzett, az ország területének nagyjából egynegyedét

(4-5 megye) érintő légifelvételezés, illetve a légifelvételekből előállított ortofotó adja.

A rendszerben szereplő blokkok egyik fontos tulajdonsága a támogathatóságra

vonatkozik, azaz hogy igényelhető-e rá mezőgazdasági támogatás. Jellemző

támogatható területek például a szántók és a legelők, jellemző nem támogatható

területek az erdős, fás, bokros területek. A bemutatott alkalmazásom célja e területek

elkülönítése. A cél elsősorban a legelőként támogatható területeken megjelenő fás,

bokros területek automatikus lehatárolása, és a támogatható területekből való kivágása.

A feladat jellege nagyon nagy pontosságot kíván meg, az ortofotók geometriai

felbontása (0,4 m2) ezt lehetővé tenné, ugyanakkor pont e nagyon nagy felbontás a

felszínborítás olyan jellegzetességeit is rögzíti, melyek tévesztéseket eredményeznek. E

miatt a művelet teljes automatizációja nem megengedhető.

A feladattal kapcsolatban a pontosság mellett további geometriai elvárások

adottak. A MePAR felbontása nem olyan részletes, mint a felvételekből származó

vektoros eredményeké (MePAR méretű rendszert az ilyen felbontás kezelhetetlenné

tenné). Ezért az eredményeket generalizálni kell. Továbbá a 0,1 ha-nál kisebb

- 49 -

területeket nem kívánjuk rögzíteni. A lehatárolt területeket egy ún. negatív bufferrel (1

pixel mérettel) szűkíteni kell, mivel nem a felszín, hanem a lombkorona kerül

lehatárolásra. A programrendszerrel megoldható az ezen elvárásoknak való megfelelés,

geometriai jellegű műveletek végrehajtásával az osztályozás után.

A feladat pixel-alapon nem megoldható, ugyanis a használt felvétel geometriai

felbontása miatt a felszínborítási egységek nagyobbak a képpontnál. Ez a felbontás

egyfelől nagy geometriai pontosságot tesz lehetővé, ugyanakkor lokális spektrális

jellegzetességek megnehezítik az osztályozást, ugyanis nagyon nehéz elválasztani

egymástól a valóban facsoporthoz tartozó objektumokat és az esetleg hozzájuk nagyon

hasonló, de egyéb felszíni objektumhoz tartozó szegmenseket. Ilyen esetben

előfordulhat, hogy vizuális kiértékeléssel sem dönthető el egyértelműen a kérdés.

7. 1. A felhasznált felvételek

A MePAR felújításhoz minden évben megadott területről digitális légifelvételek

készülnek. A felvételezés három sávban történik, készül a látható tartománynak

megfelelő, illetve CIR felvétel, mindkét esetben sávonként 8 bites mélységben

kvantálva. A légifelvételből állítható elő a képelemző rendszerekkel feldolgozható

ortofotó. Az ortofotó térképileg helyes, területmérésre is lehetőséget adó felvétel.

Az alkalmazásban a CIR ortofotókat használom. A felvételek térbeli felbontása

0,4 (2009 évi felvételek esetén) és 0,5m. A szabályrendszer fejlesztése a 2009-es

felvételeken történt, mely Bács-Kiskun, Fejér, Tolna és Baranya megyéket fedi.

A mezőgazdasági célú felhasználás miatt a felvételezés a nyár folyamán, a

felhőtlenség érdekében általában a délelőtti órában történik.

7. 2. A feldolgozás folyamata

A feldolgozás három fő lépésből áll. Első lépés a felvételek szegmentálása, majd a

szegmentálással kapott objektumok osztályozása következik, végül az említett

geometriai feltételeket utófeldolgozási lépésekben biztosítjuk.

- 50 -

Elsősorban az osztályozásnál figyelembe kell venni a felvételek készítéséből

faladó térbeli és időbeli tényezőket, melyek lokális sajátosságokat eredményeznek. A

felvételek nem egy időpontban készülnek, emiatt elsősorban megvilágításbeli

különbségek, a napsugárzás beesési szögének változása és így az árnyékolás

módosulása tapasztalható a felvételeken. Térbeli változásokat egyrészt a nagy terület

miatt, másrészt a domborzati viszonyok következtében tapasztalunk. Egyes, a

kategorizáláskor fontos jellemzőket ugyanis befolyásolja, hogy az adott felvétel például

a Kiskunságon, a Mezőföldön, vagy a Mecsek környékén készült. A domborzat szintén

befolyásolja a megvilágítást. Ezen tényezők miatt több szabályrendszer készült,

általában 1:100000-es EOV szelvényenként módosítva. A módosítások csak az

osztálydefiníciókat érintik, a szegmentálást nem.

Az utófeldolgozás egy része a geometriai követelményeknek való megfelelés

biztosítása, ez a szabályrendszerben megvalósított. Az eredmények MePAR-beli

feldolgozásához további, térinformatikai adatbázisban végzendő műveletekre van

szükség, melyek a dolgozat témájához nem kapcsolódnak, így ezeket nem részletezem.

A részletes leírás során kettő területet mutatok be, a Kiskunságon (Izsák-

Orgovány községek környezetében) és a Völgységben (Tolna- és Baranya megye

határa) alkalmazott osztályozást. Az ábrákon a felvételek hamis színes kompozitjai

láthatóak (R: közeli infravörös, G: vörös, B: zöld).

A fás, bokros területek elkülönítése más növénytakarástól elsősorban texturális

jellegzetességek útján történhet, ezért a feldolgozás texturális mértékekre erősen épít. A

textúra mérésére részben a már említett GLCM mátrix módszerrel, részben az

objektumok képpont-értékeinek szórását vizsgálva történik.

7. 3. Szegmentálás

A szegmentálás elsődleges szempontja a lehatárolandó objektumok

határvonalának pontos követése. Lehatárolt területek belüli megkülönböztetés nem

része a feladatnak, ezért például a különböző fafajták határvonalának szegmensekkel

való követésére nem törekedtem. További fontos szempont, hogy a várhatóan nem

lehatárolandó homogén területek a lehető legnagyobb szegmenseket alkossák. Így az

- 51 -

osztálydefiníciókban méretbeli korlátokat is bevezethetünk, továbbá a feldolgozandó

objektumok száma jelentősen csökken.

A szegmentáláshoz a képi sávok mellett további rétegeket vezetünk be. Ezek a

három sáv átlagából kapott fényesség (brightness), az NDVI, valamint a nir sáv alapján

számolt éltérkép (Canny-féle éldetektálással). Az éltérkép az objektumhatárok

megtalálása mellett jelen esetben a fák lombkoronájában megfigyelhető lokális

intenzitásváltozások kiemelésére is alkalmas, elsősorban ez utóbbi tulajdonsága miatt

alkalmazom.

A szegmentálás több lépésben történik, a kívánt eredményt fokozatosan közelítve.

A felvételek nagy mérete miatt 2000x2000 pixel méretű cserepeken történik, de emellett

is nagyon sok objektumra számítunk, ezt redukálom a szegmentálás első lépésében.

1. lépés: „quadtree segmentation” a vörös, a közeli infravörös és a fényesség

sávok alapján, scale = 30 paraméter mellett. A lépés célja az objektum-szint létrehozása.

Az algoritmusnak megfelelően a kapott objektumok négyzet-alakúak, a lokális

homogenitásnak megfelelő méretben. Inhomogén területen előfordulhat 1 pixel méretű

objektum is, határvonalakon jellemzően 4, lombkoronában 4-16 képpont méretű

objektumokat kapunk, de homogén területeken ennél jóval nagyobb lehet egy objektum.

Ezek az objektumok felhasználható információt még nem hordoznak, további

lépésekre van tehát szükség.

2. lépés: „multiresolution segmentation” a vörös, a nir, az ndvi, a fényesség és az

éltérkép alapján, az éltérkép sávot kétszeresen súlyozva. A paraméterezése: Scale = 10,

Shape = 0,1, azaz a spektrális homogenitást részesítjük előnyben, Compactness = 0,9,

azaz kompakt objektumokat várunk.

A kapott eredmény az objektumhatárokat jól követi, ugyanakkor nagyon hasonló

szomszédos objektumok maradnak, ezek összevonása szükséges, elsősorban homogén

területeken.

- 52 -

16. ábra: szegmensek a második lépés után

Itt meg kell említeni, hogy a célkategóriákba nem tartozó homogén területeken is

előfordulhatnak lokális jellegzetességek, amelyek a szegmentálás jelenlegi lépésében

önálló objektumot alkotnak. Ezen objektumok tulajdonságaik alapján bekerülhetnek

valamely kategóriába, ugyanakkor megfelelő mértékek alapján a szomszédos, homogén

területekhez állnak közelebb, amivel összevonhatóak. Ennek megoldása legalább

annyira fontos lépés, mint a határkövető szegmentálás, ennek érdekében újabb

összevonást hajtunk végre.

3. lépés: „spectral difference segmentation”: a zöld, a vörös, a nir, a fényesség és

az ndvi sávok alapján. Paraméterezése: Maximum spectral difference = 5. A lépés a

homogénebb területeket nagy objektumokká összevonja, az inhomogén célterületeken

kisebb összevonásokat hajt végre.

- 53 -

17. ábra: szegmensek a harmadik (utolsó) lépés után

A kapott eredmény megfelel az előzetes elvárásnak. Bár a szegmentálás itt

lezárulhatna, még egy lépést alkalmazunk, a szomszédos cserepek határán létrejövő

azonos tulajdonságú objektumok összevonására. Ehhez szükséges egy logikai változó

definiálása az objektumokhoz, mellyel a határokat érintő objektumokat jelöljük. A

cserepek összeillesztése után az osztályozó lépések előtt még egy „multiresolution

segmentation” szegmentálást hajtunk végre a határobjektumokon. A paramétereket úgy

állítjuk be, hogy csak a szomszédos cseréphatárokon található szegmenseket vonja

össze (megismételve a korábbi lépés paramétereit - így az azonos cserépen lévő

objektumok nem vonhatók össze).

A szegmentáló lépések minden célterületre fejlesztett szabályrendszerben

megegyeznek.

- 54 -

18. ábra: szegmentálás eredménye más jellegű területen

7. 4. Osztályozás

A szegmentálás azonos lépésekkel és paraméterezéssel alkalmazható a teljes

célterületre, az osztályozó folyamat azonban erősen területfüggő. Egyes területeken jó

eredményeket adó szabályrendszer más jellegű területeken nem elfogadható hibás

osztályozáshoz vezet. A hibák forrása többek között az eltérő domborzati viszonyok, és

az adott területre jellemző természetes és ültetett növényzet, az előforduló fa és

bokorfajták. Mindemellett a cél minél általánosabb, a lehető legtöbb területre

alkalmazható osztályozás fejlesztése.

Az osztályozási hibákat a rendelkezésre álló felvételek alapján nem lehet teljesen

kiküszöbölni, az eredmények további felhasználásának szempontjából az első- és

másodfajú hibák nem azonos súlyúak. Ha a nullhipotézis szerint az objektum nem

tartozik a célkategóriába, akkor a tévesen osztályba sorolás jelenti az elsőfajú hibát.

Mivel a beosztályozott terület a MePAR-ban nemtámogathatónak minősül, az ilyen

tévedést nem engedhetjük meg. A másodfajú hibát a valójában osztályozandó, de

- 55 -

mégsem beosztályozott objektumok adják. Az ilyen hibák teljesen nem

kiküszöbölhetőek, ha az elsőfajú hiba teljes kizárására törekszünk. Ugyanakkor

másodfajú hiba leggyakrabban a cél szempontjából érdektelen területeken, összefüggő

erdőkben fordul elő. További hibaforrást jelenthet a lombkoronák által vetett árnyék. Az

árnyékolt területet nem osztályozhatjuk be, ami például facsoportok vagy erdő szélén jó

döntés, de összefüggő erdőterületen magasabb fák árnyékának kihagyása hibás

eredményt ad. Itt ismét megemlítem, hogy összefüggő erdőterületekben előforduló

hibák a feladat szempontjából nem jelentősek, illetve geometriai feltételek teljesülése

esetén az ilyen hiba megszűntethető.

Az osztályozás bemutatására a korábban említettek szerint két jellemző területet

választottam ki. A völgységi (és az ahhoz hasonló jellegzetességeket mutató) területek

pontos osztályozása a nem osztályozandó növényzet tulajdonságai miatt nehezebb

feladat.

19. ábra: jellegzetes kiskunsági és völgységi területrészlet

Az osztályozás első lépése az árnyékok leválasztása. A szegmenshatárok az

árnyékokat is jól követik, így, és az árnyékra jellemző tulajdonságok következtében

azok besorolása nem jelent problémát. Az osztály definíciója éles (azaz valószínűségi

görbe nélküli) küszöbértékeket tartalmaz, a fényesség és a nir sávra felső, a nir sáv

GLCM homogenitására alsó korlátot adunk. Az árnyékok leválasztása után a későbbi

osztályozás könnyítésére a bármilyen növényzethez tartozó objektumok beosztályozása

történik meg, a további lépések csak ezen objektumokat vizsgálják. A növényzet

elkülönítésére értelemszerűen az ndvi indexet használjuk. Az ndvi értéke jellemzően a

- 56 -

[-1, 1] intervallumba esik, a magasabb érték magasabb klorofill-elnyelésre, így a zöld

növényzet hangsúlyos jelenlétére utal. Korlátnak 0-t választva elfogadható eredményt

kapunk, melyet geometriai tulajdonságok alapján tovább javíthatunk. A homogén

területek (szántóföld, legelő, gyep) nagyméretű szegmenseket alkotnak, így alkalmas

méretkorlát mellett ezeket a további vizsgálatból kizárhatjuk. Továbbá egy jellemző

hibaforrás, a szántókban látható szekérutak, traktornyomok hatása is részben

kiküszöbölhető. Ezek ugyanis a fákhoz spektrálisan hasonló tulajdonságokat

mutathatnak, így tévesen beosztályozhatóak, ugyanakkor geometriai jellegzetességük

(általában keskeny, hosszú szegmensek) alapján kiszűrhetőek. Ezek alapján a növényzet

osztály definíciója az ndvi indexre valamint szegmensméretre és alakra vonatkozó

korlátokból áll.

20. ábra: növénytakaró kiválasztása NDVI alapján

A következő lépés az osztályozás lényegi része. A fás, bokros területek

spektrálisan és texturálisan is, bizonyos jellegzetességek mellett nagyon változatos

képet mutatnak. A célkategórián belüli fajta-megkülönböztetés nem része a feladatnak,

így a végeredmény alkategóriákat nem tartalmaz, a folyamatban mégis szükségszerű

alosztályok bevezetése. Ezen alosztályokat fajtaismeret nélkül, csupán a mutatott

jellegzetességek alapján vezetem be. A felvételek részletes vizuális áttekintése és

kísérletezés alapján kilenc kategóriát határoztam meg. A kategóriák definiálásának első

lépése a mintavételezés. Mintának minden kategóriából azt jól jellemző, lehetőleg minél

nagyobb számú objektumot választottam. A minták az objektumok kiválasztott

- 57 -

tulajdonságai alapján valószínűségi görbéket definiálnak, melyek az osztály leírásába

kerülnek. Azaz ezek alapján maximum-likelihood döntéssel minden objektumról

eldönthető, melyik osztályba tartozik a legnagyobb valószínűséggel. Értelemszerűen

előfordulhat, hogy az objektum egyik osztályba sem tartozik, ezért csak a P > 0,1

valószínűségeket vesszük figyelembe. A valószínűségi görbéket csak spektrális

tulajdonságok, az egyes sávok átlaga és szórása adják. Geometriai tulajdonságok ilyen

leírására nincs szükség, a texturális tulajdonságok nagy számításigénye pedig

kezelhetetlenül lassúvá teszi a feldolgozást. E tulajdonságok így fix küszöbként

kerülnek be az osztályleírásokba. A leírásban logikai operátorokat is használhatunk,

egyes tulajdonságok egymást kizáró, vagy együttes meglétének biztosítása érdekében.

Az alkalmazott texturális mérték minden esetben a GLCM homogenitás.

21. ábra: egy osztályhoz tartozó valószínűségi görbék (eCognition felület)

Értelemszerűen mind a valószínűségi görbék, mind a fix küszöbértékek

kísérletezéssel és teszteléssel folyamatosan javítandóak. A tesztelés kis területeket

kiválasztva, és az osztályozást azon elvégezve történik. A görbéknek mind a határa,

mind az alakja módosítható. Az egyes területekre fejlesztett szabályrendszerek között

legnagyobb különbség e ponton van, a görbék jellemzőiben és a küszöbértékekben.

Egyes területeken hasznosnak bizonyul további kategóriák hasonló módon történő

bevezetése, melyekbe biztosan nem lehatárolandó objektumok kerülnek. Előfordul

ugyanis, hogy ilyen objektumok, bár láthatóan nem tartoznak a célkategóriába,

- 58 -

tulajdonságaik alapján mégis besorolást nyernek valamelyik osztályba. Ezek

kiküszöbölésére szűk tartományú görbékkel definiált osztály alkalmas lehet.

22. ábra: az osztályozás eredménye a mintaterületeken (zöld: nem fás jellegű növény, kék árnyalatok: fatípusok)

A folyamat következő lépése a kapott eredmény javítása szűkítéssel. A cél olyan,

azonos kategóriába eső szomszédos objektumok kiválasztása, melyek egyenként

megfelelnek az osztálydefiníciónak, összevonva azonban nem teljesítenek valamilyen

feltételt. Elsősorban nagy területű, összefüggő, inhomogén textúrájú természetes

növényzet (például felhagyott mezőgazdasági, gyomos területek) okozhat ilyen hibákat.

Ennek kiszűrésére az azonos kategóriába tartozó szomszédos objektumokat

összevonjuk, majd megvizsgáljuk az összevont objektum adott feltételnek való

- 59 -

megfelelését. A kritériumok egyrészt geometriai jellegűek, valamilyen méret

meghaladása esetén az objektum az osztályból kizárandó, illetve texturális,

homogenitási korlát elérése lehet. Ezen kritériumok megadása az osztályozás nagyobb

területen történő végrehajtásával, annak hibás eredményeinek vizsgálatával lehetséges.

A továbbiakban már csak geometriai lépésekre van szükség. A végeredményben

csak egy kategória van, a jelenlegi osztályokat összevonhatjuk egy osztályba. A

szomszédos objektumok összevonása után a nem besorolt objektumok egy részét, azon

elemeket, melyek csak beosztályozott objektummal határosak, és egy méretkorlát alatt

maradnak, beosztályozunk. A lépéssel az erdős területekben előforduló homogén

foltokat, illetve árnyékként bekategorizált objektumokat, továbbá mezőgazdasági

tevékenységre alkalmatlan (például nehezen megközelíthető, kis méretű) tisztásokat

kezeljük. Az ilyen területek besorolása az eredmény felhasználóinak elvárása, része a

feladatnak (a méretkorlát is adott).

23. ábra: teljesen körbezárt, be nem osztályozott szegmensek kiválasztása geometriai jellemzők alapján (sárga objektumok)

A további, a felhasználói elvárásokat biztosító geometriai lépések az

utófeldolgozási folyamat részei.

7. 5. Utófeldolgozás

A geometriai elvárásoknak való megfelelés is megoldható a szabályrendszerben.

A generalizálás, valamint a szűkítés egy lépésben megvalósítható. A képfeldolgozásban

- 60 -

ismert morfológiai műveletek, a „shrinking” és „growing” alkalmazható a besorolt

objektumokra. A szűkítést 1 képpont méretű „shrinking” megoldaná, azonban 3 képpont

méretű „shrinking” majd 2 képpont méretű „growing” hasonló, de generalizáltabb

eredményt ad, ugyanis a növelés nem a korábbi állapot, hanem az aktuális

objektumhatár alapján dolgozik, így az eredeti cizellált határvonal leegyszerűsödik.

24. ábra: a generalizálás (régiócsökkentés és növelés) hatása

Utolsó lépésben a 0,1 ha-nál kisebb objektumok kiszűrése történik meg. Ezután az

osztályba tartozó objektumokat exportáljuk, a kapott eredmény vektoros formában, ún.

shapefile-ban áll rendelkezésre, mely térinformatikai rendszerekkel kezelhető.

25. ábra: az osztályozás végeredménye a mintaterületeken

7. 6. Pontosság

A pontosság kérdését már többször említettem. Az eredmények támogatható

területek méretét, és így a kifizetett támogatások összegét befolyásolja, ezért a módszer

- 61 -

automatikus felhasználásához nagyon pontos osztályozásra lenne szükség. Ugyanakkor

az elérhető pontosságot több tényező is befolyásolja. A felvételezés technikájából

fakadóan a légköri, megvilágításbeli tényezők nem egységesek, de űrfelvételekhez

hasonló kalibrációra (ToA reflektancia) nincs lehetőség. E mellett a nagyon nagy térbeli

felbontás olyan lokális jellegzetességeket is kiemel, amelyek következtében az adott

objektum tulajdonságai eltérnek a saját kategóriájától, esetleg egy más kategóriára

jellemző értékeket vehetnek fel, így téves osztályozáshoz vezetnek. Előfordulnak olyan

objektumok, melyekről vizuális kiértékeléssel sem dönthető el egyértelműen, hogy

milyen felszínborítási kategóriához tartoznak.

Mindezek mellett az elért pontosság általánosan elfogadható, a vizuális

interpretációt nem válthatja ki, de az interpretátor feladatát jelentősen megkönnyítheti.

7. 7. Javítási lehetőségek

A kapott eredményeknél kevesebb hibával járó, nagy területen, általánosan

alkalmazható, teljesen automatikus feldolgozásra alkalmas osztályozás a bemenő adatok

körének bővítésével lenne lehetséges. Több felvétel rendelkezésre állásával idősor-alapú

módszert lehetne kidolgozni, illetve változáskövető vizsgálatra is lehetőség lenne.

Ugyanakkor ilyen felbontásban nem áll rendelkezésre több különböző időpontban

készült felvétel (idősor-alapú elemzéshez egyazon évben, meghatározott

időintervallumokban készült felvételek szükségesek). A rendelkezésre álló HR

felbontású felvételek térbeli részletességük miatt nem alkalmazhatóak. Más

megközelítésben a feladat specializálásával, a vizsgálandó területek jellegének

szűkítésével javítható lehet az eredmény.

- 62 -

8. Vörösiszap-elöntés (katasztrófa-felmérés)

Már említettük, hogy a távérzékelés egyik fontos feladata a légi- vagy űrfelvételeken

látható környezeti és ipari katasztrófák felmérése. A FÖMI-ben ár- és belvízfelmérés,

aszályfelmérés, valamilyen kártevő (pl. gyapjaspille) kártételének vizsgálata rendszeres

feladatok. A rendszeresen megismétlődő természeti katasztrófák mellett előfordulnak

egyedi események is, melyeknek távérzékeléssel vizsgálható környezeti hatásuk van.

Ilyen esemény történt 2010. október 4-én Ajka mellett, amikor a Magyar Alumínium

Zrt. egyik zagytározójának (X. kazetta) gátja átszakadt, és a tárolt erősen lúgos

kémhatású vörösiszap egy része elöntötte a környező területet. Az elöntés érintette

három település belterületét, mezőgazdasági területeket, vízbázisokat, valamint a Torna

patakon keresztül a Marcal és a Duna folyókat is. A FÖMI-ben végrehajtott katasztrófa-

felmérés többek között a terület méretét, a részben vagy egészben elöntött

mezőgazdasági parcellák jellemzőit vizsgálta. E vizsgálatok keretében végeztem

objektum alapú elemzéseket szuperfelbontású űrfelvételeken. Munkám elsősorban

kutató jellegű, nem operatív felhasználásra készült (a felvételek késői időpontja, és

hiányos fedésük miatt), de összehasonlítható terepi felmérésből, légifelvételezésből

nyert adatokkal.

8. 1. A felhasznált felvételek

Az időjárási viszonyok miatt felhasználható VHR felvétel csak napokkal a

katasztrófa után készült.

Az első felvétel: 2010. október 9-én készült 8 sávos, 2m felbontású WorldView2

(WV2) felvételből előállított toa-reflektancia kép. A felvétel spektrális felbontása is

nagyon jó, a látható tartomány mellett egy vörös-határ (a látható és közeli infravörös

tartomány határa), két közeli infravörös, valamint a látható kék tartományhoz közeli,

rövidebb hullámhossz-tartományban érzékelő sáv áll rendelkezésre. A sávok név

szerint: 1. coastal, 2. blue (kék), 3. green (zöld), 4. yellow (sárga), 5. red (vörös), 6. red-

edge (vörös-határ), 7. near infrared 1 (közeli infravörös), near infrared 2, ez utóbbiakat

- 63 -

nir1 és nir2-vel rövidítem. A coastal sáv elsősorban nyílt vizek vizsgálatakor

használható, ezt illetve a nir2 sávot a feldolgozás folyamán érdemben nem használtam.

A cél az elöntés minél pontosabb lehatárolása volt, ezért a felvétel területi felbontása

jobban kihasználható, mint a spektrális gazdagsága. A felvétel gyakorlatilag felhőtlen,

ugyanakkor nem fedi a teljes elöntött területet. Egyes területeken kivehető a katasztrófa

utáni első helyreállítási munkálatok hatása is.

A második felvétel: 2010. október 7-én készült RapidEye felvétel, melynek térbeli

felbontás 5m, 5 spektrális sávban felvételez: 1. kék, 2. zöld, 3. vörös, 4. vörös-határ, 5.

közeli infravörös. A felvétel felhős, a felhővel takart, illetve árnyékolt területeken a

felvétel nem feldolgozható.

A feldolgozás részét képezte a két felvétel különbségéből adódó eltérések

vizsgálata. A módszert a WV2 felvételen dolgoztam ki, majd azt átültettem a RapidEye

felvételre is.


A végeredményként kiadott tematikus térkép egyszerű elöntéstérkép, azaz nincs

az elöntött terület jellege szerint kategóriákra bontva. Az osztályozás megkönnyítése

végett bevezettem ideiglenes kategóriákat az elöntés mértéke és az elöntött terület

jellege (talaj, növényzet) alapján, de ez csak a felvételen látható viszonyok alapján

történt, terepi felmérésből vagy mezőgazdasági adatbázisból származó megerősítés

nélkül.

8. 3. Spektrális indexek

Egy fontos spektrális index, az NDVI alkalmazásáról a fák lehatárolásánál már

volt szó. Index az NDVI-hoz hasonló módon más sávokból is képezhető, gyakran

használunk például talaj- és nedvesség-indexeket (NDSI, NDWI), bár ezekhez a most

használt felvételtípusokon nem lévő közepes infravörös sáv szükséges. Ugyanakkor a

WV2 felvétel spektrális gazdagsága további indexek alkalmazására ad lehetőséget. A

lehetséges sávok kiválasztása többféle módon történhet, vizsgálhatjuk statisztikai

- 64 -

módszerekkel az egyes sávok kovarianciáját, ezek különbségét a felvételen előforduló

különböző felszínborítási elemek esetén. Célszerű ezt az utat követni, ha a feldolgozás

többször alkalmazandó. Jelen esetben egyszeri alkalmazásról van szó, a használandó

indexeket statisztikai módszer helyett a spektrális tulajdonságok vizuális értékelése

alapján választottam ki. Ez egy térinformatikai software, az ERDAS Imagine 9.1.

segítségével történt. Első lépésben mintaterületeket választottam a felvételen, arra

törekedve, hogy minden érdekes felszíni objektumból legyen minta. Ezen minták

spektrális tulajdonságait vizsgálva a cél olyan sáv-párok megtalálása, melyek

együttváltozása jól jellemzi az adott felszínborítást. A választás a következő indexekre

esett: ndvi (a nir1 sávból), vörös - zöld és a vörös - vörös-határ sávokból képzett

indexek. A látható vörös többszöri jelenléte a vizsgált esemény jellege miatt is várható

volt. A feldolgozás első lépéseként a megfelelő sávokból a már említett módon

létrehozzuk ezen spektrális indexeket.


A szegmensek létrehozásakor elsődleges cél a felszínborítási objektumok, illetve

az elöntés határának szigorú követése a szegmenshatárokkal. Másodlagos célként

szegmenseken belüli homogenitásra törekedtünk.

Már többször említettem, hogy az alkalmazható módszerek és a

paraméterezhetőség sokrétűsége miatt az optimális végeredményt kísérletezéssel, a

paraméterek módosításával, többféle szegmentálás összekapcsolásával érhetjük el.

A több lépésben történő finomítással a várt eredmény fokozatos közelítése a cél.

A felvétel mérete és a szegmentálás memóriaigénye miatt itt is alkalmazzuk a már

említett „Tiling and Stitching” technikát, azaz a felvételt 2000x2000 pixeles darabokra

osztva szegmentálunk. Itt is megadjuk a szegmentálás lépéseit:

1. lépés: „multiresolution segmentation” a vörös - zöld és a vörös-határ - vörös

indexek alapján, (a vörös-zöld kétszeres súllyal) további paraméterek: scale = 3, shape =

0, compactness = 0,9.

- 65 -

Az első lépés még pixelszinten történik, a szegmentálás mellett az objektumok

létrehozásáért is felel. Minden további lépés az objektumok szintjén történik.

26. ábra: a szegmensek az első lépés után

Az első lépés eredménye a kitűzött célokat jól közelíti, de lokális hibák miatt további

lépésekre van szükség. A hibák olyan területeken jelentkeznek, ahol a szegmentálást

meghatározó indexek szerint homogén a terület. Először felmerülhet a gondolat, hogy

például az alábbi képen jól látható szegmentálási hiba elkerülhető lenne több sáv

bevonásával. A kísérletezés tapasztalata, hogy a hasonló lokális hibákat javítandó több

sáv szerinti szegmentálás általánosan rosszabb eredményt ad. Ezért egy második

szegmentáló lépést alkalmazunk, melyben az ilyen területeket szétvágjuk.

- 66 -

27. ábra: hibás szegmens

2. lépés: „contrast split segmentation” a felvétel zöld sávja alapján, a

paraméterezéshez a software felkínált értékeit használjuk, kivéve a step size = 2

beállítást. Ez a lépés a szegmenseket feldarabolja. A hibákat megszűnteti, ugyanakkor

számunkra érdektelen inhomogenitások felesleges felosztást eredményeznek, ezért még

egy szegmentáló lépést végzünk.

28. ábra: a szegmensek a második lépés után

- 67 -

3. lépés: „multiresolution segmentation” a vörös sáv, a vörös-zöld és a vörös-határ

- vörös indexek alapján, az első lépéssel megegyező paraméterezés mellett. A kapott

eredmény az egész felvételen elég pontosan követi az elöntés határait, az elöntésen

belüli változások követési pontossága is megfelel a célnak, további szegmentáló

lépésekre nincs szükség.

29. ábra: a szegmentálás végeredménye

8. 5. Osztályozás

Az osztályozás mintavételezéssel, maximum likelihood (ML) módszerrel történik.

A végeredmény csak egy kategória, az elöntött terület, de az osztályozási folyamatban

három célkategóriát adtam meg: nyílt iszapborítás, elöntött talaj és elöntött növényzet.

Terepi felmérés vagy más megerősítés híján e kategóriák megfelelése a valóságnak nem

igazolt, ugyanakkor a felvételen jól kivehető a három kategória eltérése. E három

kategóriát megfelelő számú mintával írjuk le. Az osztályok nem diszjunktak, de elég

szűkek ahhoz, hogy a téves osztályozások száma a lehető legkisebb legyen, egy

kategória alkalmazása mellett a hibák száma jóval nagyobb lenne. A mintákra illesztett

eloszlásokat kismértékben szükséges javítani, ez az osztályozás kis területen történő

- 68 -

tesztelésével, a függvény megfelelő módosításával elvégezhető. Az osztályozáshoz

felhasznált jellemzők: vörös, vörös-határ, nir1, nir2 sávok és a három spektrális index

átlaga, és a nir1, nir2 sávok valamint a, vörös-határ - vörös index szórása. A többi átlag

és szórás nem jellemzi jól az egyes osztályokat, de téves találatok kiszűrésére e

sávokban adhatunk fix küszöbértékeket. Az ilyen küszöb a ML módszerben 0 vagy 1

valószínűségnek felel meg.

30. ábra: az osztályozás eredménye (három kategória)

Eddig csupán spektrális jellemzőket alkalmaztunk a folyamatban, de a következő

lépésben kihasználjuk objektum alapú elemzés egyes további lehetőségeit. Egyes

területeken a nem elöntött, növényborítás nélküli talaj spektrális tulajdonságai

nagymértékben hasonlítanak elöntött területekéhez. Ez téves találathoz vezet,

ugyanakkor az ilyen szegmensek várhatóan elszigeteltek, nem kapcsolódnak helyesen

osztályozott szegmensekhez. Azaz a geometriai lehetőségeket kihasználva, a valamely

kategóriába sorolt objektummal nem határos találatokat kivesszük az eredményből.

- 69 -

8. 6. Pontosság

Mind a szegmentálás, mind az osztályozás pontosságáról elmondható, hogy a

gátszakadás helyétől távolodva romlik, ahogy a felszín jellegzetességei jobban

befolyásolják az elöntést. Egy kis területen felhőárnyék van, ott nem történik

osztályozás. Az elöntés fás területeket is érint, ahol a lombkorona teljesen eltakarja a

talajt, az osztályozás ilyen területeken nem ad eredményt. A beépített területek és az

infrastruktúra szintén nehezen kezelhetőek, a műutak például, vélhetően a

katasztrófavédelmi és helyreállítási forgalom miatt – a gépjárművek futóművei

elhordják a megszáradt iszapot – olyan helyeken is elöntöttnek tűnhetnek, amelyeket

biztosan nem érintett az áradás.

Az ilyen hibákat geometriai tulajdonságok alapján lehetőség van javítani. A

besorolt objektumokkal teljesen körülvett, de nem beosztályozott szegmenseket egy

méretkorlátig besorolhatjuk, az úthálózat szegmensei kiszűrhetőek például az objektum

vékonysága alapján.

8. 7. A RapidEye felvétel feldolgozása, összehasonlítás

A feldolgozás a WV2 felvételhez hasonlóan, de egyszerűbb lépésekkel zajlott. A

WV2 felvétel feldolgozásakor használt spektrális sávok a RapidEye felvételen is

rendelkezésre állnak, ugyanakkor figyelembe kell venni az eltérő térbeli felbontásból

származó különbségeket. A RapidEye felvételből nem áll rendelkezésre toa-reflektancia

kép, ennek előállítása bonyolult, a felvétel készítésének paraméterei (pl. napállás

szöge), valamint a szenzorra jellemző konstansok ismerete szükséges hozzá. Ettől jelen

esetben eltekinthetünk, de több felvételen ismétlendő, vagy idősor-alapú elemzések

kalibrálatlan felvételeken nem hajthatók végre.

8. 7. 1. A RapidEye felvétel szegmentálása

Egy lépésben, „multiresolution segmentation”, zöld sáv, vörös-határ - vörös, és

vörös - zöld indexek alapján (ez utóbbi kétszeres súlyozással), további paraméterezése:

scale parameter = 2, Shape = 0, Compactness = 0,9.

- 70 -

A szegmentálás eredménye általánosan megfelelő, de a felvétel gyengébb térbeli

felbontása miatt a határvonalakon nem elég pontos. A határvonal pontossága további

lépésekkel nem javítható, a határpixelek értékei ugyanis nagyobb terület (25 m2)

sugárzási átlagából származik, ez az érték pedig nem kellően determinisztikus. Ezért

további szegmentáló lépéseket nem hajtok végre.

31. ábra: a RapidEye felvétel szegmentálása

8. 7. 2. A RapidEye felvétel osztályozása

A szűkebb spektrális és térbeli lehetőségek miatt csak két alkategóriába

osztályozunk. A módszer megegyezik a WV2 esetében leírtakkal, geometriai

tulajdonságok figyelése nélkül.

- 71 -

8. 7. 3. Eredmények

A RapidEye osztályozása több téves találatot eredményez, ezek sötétebb tónusú

talajok és egyes elöntött területek spektrális tulajdonságainak egyezéséből származnak.

32. ábra: a WorldView 2 felvétel osztályozása

33. ábra: a RapidEye felvétel osztályozása (a képi háttér a WorldView2 felvétel)

- 72 -

Ezek a téves találatok geometriai úton kiszűrhetőek, bár egyes helyeken ezek az

objektumok kapcsolódnak helyesen osztályozott objektumokhoz, így a WV2

feldolgozása során használt kritérium ezen szegmensekre nem alkalmazható.

34. ábra: a RapidEye felvétel jellemző osztályozási hibái

A térbeli felbontásbeli különbség szintén megmutatkozik az eredményekben. A

WV2 osztályozása az elöntés határvonalát pontosabban követi.

A WV2 felvétel egy pixele 4 m2, míg a RapidEye felvételen ez 25 m2 területet fed le,

azaz az egyes határpixelek spektrális értékei jóval nagyobb területről származnak.

Elsősorban ebből következik a RapidEye osztályozás pontatlansága. A spektrális

felbontásbeli különbség kevésbé látványos, a téves találatok számában jelentkezik.

- 73 -

35. ábra: a WorldView2 felvétel osztályozásának geometriai pontossága

36. ábra: a RapidEye felvétel osztályozásának gyengébb geometriai pontossága

Az eredményeket bemutató képeken a háttér a RapidEye felvétel osztályozáshoz

is a WV2 valódi színes kompozitja.

- 74 -

9. Parlagfű kimutatás objektum alapon

A FÖMI egyik jelentős feladata a parlagfű-fertőzöttség elleni közérdekű védekezés

támogatása távérzékeléses módszerrel. Természetesen a városokban előforduló,

elhanyagolt kertekben, közterületen jelen lévő parlagfű nem kimutatható légi- vagy

űrfelvételeken, ugyanakkor a mezőgazdasági területeken, elsősorban kalászos tarlókon

jelentkező fertőzöttség mérhető távérzékeléssel. Megjegyzendő, hogy az ilyen,

mezőgazdasági területeken való előfordulás adja az erősen allergén növény összes hazai

megjelenésének legnagyobb hányadát.

A távérzékeléses felmérés önmagában nem elegendő a védekezési folyamat

lebonyolításához, de fontos támpont a terepi ellenőrzés elvégzéséhez.

A hagyományosan alkalmazott módszer HR felvételek idősor-elemzésével, terepi

felméréses megerősítés mellett történő pixel-alapú feldolgozás, de a 2010-es évben egy

szuperfelbontású felvételek feldolgozási lehetőségére irányuló kutatási folyamat

részeként a VHR felvételek parlagfű-kimutatásra való alkalmasságát is vizsgáltuk.

Ennek keretében objektum-alapú feldolgozást végeztem, melynek eredményeit

összevetettük képpont-alapú eredményekkel. A vizsgálat kalászos tarlókra, illetve

szójával ültetett területekre terjedt ki.

9. 1. Felhasznált felvételek

2010. szeptember 22-én Dél-Baranyáról (Villány környéke) készült WorldView2

felvételrészlet. A felvétel paraméterei az előző részben leírtakkal megegyezők.

2010. október 8-án végzett terepi felmérés eredményei, valamint a mezőgazdasági

kategória maszkok a kalászos tarlók és a szójaültetvények térbeli leválogatására.

- 75 -


A parlagfű-kimutatás nem az objektumok egyenkénti, hanem az adott jellegű

területtől (pl. kalászos tarló) várt tulajdonságoktól való eltérés, valamint növény-okozta

texturális jellegzetességek megtalálását jelenti, ugyanis maga a növény még VHR

felbontásban sem látszik a felvételen. Az elemzéshez használt tanuló és tesztterületek

kijelöléséhez szükség volt a felvételezett területről, a felvételezés időpontjához közeli

időpontban történő terepi felméréshez. A lehetséges célterületek kijelölése az idősor-

alapú elemzés eredményei alapján történt. A terepi felmérés hagyományosan öt

kategóriát különít el, ezek valamelyikébe osztva a felmért területeket:

1. parlagfűvel erősen fertőzött

2. parlagfűvel és más gyomokkal együttesen fertőzött

3. más gyomokkal fertőzött, kis mértékben parlagfüves

4. gyomos, de nem parlagfüves

5. betárcsázott

Ezt a kategorizálást jelen estben csak részben tudjuk alkalmazni, ugyanis a felmért

terület kis méretéből adódóan az egyes kategóriákból nem érkezett kellőszámú

eredmény, illetve a betárcsázások időpontját nem ismeretük, ezért csak három

kategóriát különítettem el (1., 2-3. összevonva, 4.).

A két mezőgazdasági kategória fertőzöttségének a vizsgálata külön-külön

történik. Az elemzés az egész területre szolgáltat eredményeket, de értelmes eredményt

csak a kategórián belül várunk. Ezen területek leválasztását az ERDAS Imagine

térinformatikai programmal végezzük.


Amint említettük, ezúttal a célobjektumok lehatárolása nem megoldható, ezért a

szegmentálás célja a mezőgazdasági táblák egymástól való elválasztása mellett a lokális

jellegzetességek, a textúrák követése. A szegmentálás egy lépésben történik:

„multiresolution segmentation” a zöld, vörös, vörös-határ, nir1, nir2 sávok és az ndvi

- 76 -

alapján (ndvi a nir1 sávból számolva). A paraméterezése: scale = 30, Shape = 0.4,

Compactness = 0.9.

37. ábra: a szegmentálás eredménye

9. 4. Osztályozás

Az osztályozás ismét mintavételezéssel, maximum likelihood módszerrel történik.

A mintákat a terepi felmérés eredményéből választottuk mindkét vizsgált

mezőgazdasági területtípusra. Ezek egy részét tesztterületként használjuk (tanuló és

tesztterületek diszjunktak).

A kalászos tarlón alkalmazott megkülönböztetett parlagfű-fertőzöttségi

kategóriák, az eredeti terepi fertőzöttségi kódoknak megfeleltetve:

1. 50% felett parlagfüves (1. kategória),

2. parlagfűvel és más gyomokkal is fertőzött (2. és 3. kategória),

3. más gyomokkal fertőzött, nem parlagfüves (4. kategória)

A szójaültetvényekről való hiányos terepi eredmények (összesen két tábla, 1-es

fertőzöttségi kóddal) miatt ezen táblákban csak 50% felett parlagfüves területeket

keresünk.

- 77 -

A szegmensek osztályba sorolásakor az egyes spektrális sávok, valamint az ndvi,

illetve nir2 - vörös-határ indexek átlaga és szórása mellett texturális jellemzőket is

figyelembe veszünk. A textúrát most a már említett Laplace-szűrő alkalmazásával

mérjük a vörös sávon.

9. 5. Pontosság

Az eljárás pontosságának mérése nehéz feladat. A tesztterületek alapján

természetesen vizsgálható és javítható az osztályozás, de terepi megerősítésre nincs

mód, továbbá nehézséget jelent, hogy a terepi felmérés egy mezőgazdasági táblát egy

kóddal jelöl, a táblán belüli eltéréseket, parlagfű-csoportosulásokat nem jelöli, illetve a

fertőzöttségi kód meghatározása sem matematikai úton történik. A célkategóriák

spektrális tulajdonságai nagymértékű átfedést mutatnak, ami szintén korlátozza az

elérhető pontosságot.

38. ábra: a parlagfüvesként osztályozott objektumok csak a kompozitban világosbarna terület (szója) eredményeit

dolgozzuk fel

A módszer hatékonysága vizsgálható a pixel-alapú elemzés eredményével

összehasonlítva. Ez a fertőzöttségi kategóriákat összevonva történt meg, azaz fertőzött -

- 78 -

nem fertőzött osztályokba sorolva. Az összehasonlítás mind a kalászos tarlókon, mind a

szójaültetvényeken végzett elemzésekben 90% feletti egyezést állapított meg.

39. ábra: a pixelenkénti (a, c) és az objektumalapú (b, d) osztályozás eredménye a kalászos tarló (a, b) és szójaföldeken (c, d)

- 79 -

10. Összegzés

Napjainkban a távérzékelés a felvételkészítő eszközök terén töretlen és lendületes

fejlődést mutat. Mára a dolgozatban bemutatottaknál nagyságrendekkel jobb geometriai

felbontású felvételek is elérhetőek. Ez a folyamat, és az ilyen felvételek specialitása

kikényszeríti a feldolgozási módszerek változását is. Az objektum-alapú képelemzés és

annak kulcslépése, a szegmentálás ugyanakkor még nem kiforrott ága a

fotogrammetriának.

A szegmentáló algoritmusok elméleti kutatása és implementálása helyett a

szakirodalomban egyre inkább átveszi a helyet a kész, de nagyon rugalmas

algoritmusokat adó eCognition programrendszer alkalmazási lehetőségeinek

bemutatása. Az objektum-alapú elemzés hatékony és eredményes alkalmazása

érdekében azonban nem feledkezhetünk meg a szegmentáló algoritmusok

megismeréséről és megértéséről sem. Az adott feladathoz legmegfelelőbb szegmentálás

végrehajtásához elengedhetetlen az egyes lépések lehetőségeinek és korlátainak,

előnyeinek és nehézségeinek mély ismerete.

A bemutatott gyakorlati alkalmazások célja a szegmensalapú elemzés

lehetőségeinek vizsgálata, az OBIA beillesztése az Intézetben végzett képfeldolgozási

módszerek közé. Az operatív alkalmazásig való eljutás azonban rögös útnak bizonyul.

A feldolgozható adatok minőségének és mennyiségének kérdését talán nem

hangsúlyoztam eléggé, de például a parlagfű-detektáló eljárás több felvétel és több

terepi adat rendelkezésre állásával tovább finomítható és eredményesebbé tehető.

Sajnos azonban az ilyen jellegű adatok esetében a nagyobb költségekre is tekintettel kell

lennünk. Ugyanakkor az Intézet egyes újabb feladatai szükségessé teszik az objektum-

alapú elemzések felhasználását, mely alkalmazások hatékonyságához a bemutatott

feladatok megoldása komoly segítség lehet mind az objektum-alapú elemzés, mind az

eCognition rendszer alkalmazási lehetőségeinek tekintetében.

- 80 -

A. Függelék

A. 1. Adatszerkezetek

Éllistás gráfreprezentáció

Legyen a G = (V, E, ω) hármas egy irányítatlan gráf. V a csúcsok, VVE ×∈ az

élek halmaza, →∈ Eω ℝ súlyfüggvény. Minden Vv∈ csúcshoz egy listát rendelünk,

melyben nyilvántartjuk az adott csúcshoz kapcsolódó éleket, és azok súlyát. Az

ábrázolás hatékony adott csúcshoz tartozó élek feldolgozásához.

40. ábra: súlyozott, irányítatlan gráf és éllistás reprezentációja

Bináris kupac

A bináris kupac fa típusú adatszerkezet, melyben a kupac tulajdonság azt jelenti,

hogy egy szülőcsúcs értéke mindig nagyobb a hozzá tartozó gyerekcsúcsok értékeinél.

A tárolás majdnem teljes (a legalsó szint kivételével mindenhol teljesen kitöltött) bináris

fában történik, a legalsó szinten balról jobbra haladva a feltöltéssel. A kupac

tulajdonságot minden módosításkor fenn kell tartani. Hatékonyan kereshető, rendezhető

adatszerkezet.

- 81 -

41. ábra: bináris kupac faként ábrázolva

A. 2. Négyfa alapú szegmentálás

A négyfa (quadtree) adatszerkezet számos, részben a távérzékeléssel is rokon

területről ismert. Fontos alkalmazása a térinformatikai adatbázisok geometriai típusú

adatainak térbeli indexelése. Ugyanakkor a módszer bizonyos korlátok között alkalmas

képszegmentálásra, elsősorban nagy erőforrás-igényű további szegmentáló lépések

előkészítésére, segítésére használhatjuk, ezt a gyakorlati alkalmazások bemutatása során

is szemléltetem. Alkalmas továbbá képek tömörítésére is.

A módszer rekurzív, az első lépésben az egész kép egy szegmens. Ezt négy

egyenlő részre osztva négy szegmenst kapunk. Minden lépésben minden szegmenst

hasonló módon négy részre vágunk, amíg az adott szegmens meg nem felel a

homogenitási kritériumnak, vagy el nem érjük a leállási feltételt (pl. maximális

szegmensszám, minimális szegmensméret). A geometriailag kötött vágások miatt

előfordulhat, hogy a fa különböző élei mentén azonos tulajdonságú szomszédos

szegmensek is keletkeznek. Ezeket egy következő szegmentáló eljárás kiküszöbölheti.

- 82 -

Irodalomjegyzék Bevezetés a távérzékelt felvételek elemzésébe: [1] Csornai G., László I.: Távérzékelt felvételek elemzése. Előadások az ELTE

Informatikai Kar Programtervező Matematikus és Programtervező Informatikus szakán, 2005-től, diasorozat.

[2] Csornai G, Dalia O. (1991) Távérzékelés. Főiskolai jegyzet, Erdészeti és Faipari

Egyetem Földmérési és Földrendezői Kar, Székesfehérvár, 1991. [3] Richard, J.A., Jia, X. (2006) Remote Sensing, Digital Image Analysis – An

Introduction. Fourth Edition. Springer-Verlag, 2006. [4] Robert A. Schowengerdt: Remote Sensing, Third Edition: Models and Methods

for Image Processing, Elsevier, 2007. Felvételek szegmentálása, szegmensalapú feldolgozása, objektumalapú elemzés: [5] R. Schoenmakers, “Integrated Methodology for Segmentation of Large Optical

Satellite Images in Land Applications of Remote Sensing,” EUR 16292 EN, European Commission, Joint Research Centre, Sept. 1995, PhD dissertation of Katholieke Universiteit Nijmegen, http://www.cs.ru.nl/ths/dissertationsSchoenmakers-phd95.ps.gz .

[6] Kettig, R. L., Landgrebe, D. A.: Classification of Multisprectral Image Data by

Extraction and Classification of Homogeneous Object. In: IEEE Transaction on Geoscience Electronics, 14(1):19-26, 1976.

[7] Pal, N.R., Pal, S.K. (1993) A Review on Image Segmentation Techniques. Pattern

Recognition, Volume 26, Issue 9, September 1993, Pages 1277-1294. [8] Shi, J., Malik, J (2000) Normalized Cuts and Image Segmentation. IEEE

Transactions on Pattern Analysis and Machine Intelligence, Volume 22, Issue 8, Aug 2000, pp: 888 – 905.

[9] Hay, G. J., Castilla, G.: Object-based Image Analysis: Strengths, Weaknesses,

Opportunities and Threaths (Swot). 1st International Conference on Object-based Image Analysis (OBIA 2006), 4-5, July, 2006, Salzburg, Austria.

[10] Haddad, S. (2007) Texture Measureas for Segmentation. Master’s Thesis,

University of Cape Town, April 2007.

- 83 -

Szegmentálás, ELTE-FÖMI közös kutatás: [11] László, G. Nádor, I. Fekete, G. Csornai, A. Kocsis: A Segment-based

Classification Method for Satellite Images. In: Proceedings of the 5th International Conference of Applied Informatics, Eger, 2001. (pp. 151-163)

[12] László, T. Pröhle, I. Fekete, G. Csornai: A Method for Classifying Satellite

Images Using Segments. Annales Univ. Sci. Budapest, Sectio Computatorica 23, 2004. (pp. 163-178)

[13] László, B. Dezső, I. Fekete, T. Pröhle: A Fully Segment-based Method for the

Classification of Satellite Images. Annales Univ. Sci. Budapest, Sectio Computatorica 30, 2009. (pp. 157-174)

[14] Giachetta, R.: Gráf alapú módszerek műholdfelvételek tematikus osztályozásában.

Tudományos Diákköri dolgozat, ELTE, Budapest, 2008. [15] Fekete I., Dezső B, László I., Ócsai K.: A szegmentálás szerepe az űrfelvételek

tematikus osztályozásában. Az „Informatika a felsőoktatásban 2008” konferencia elektronikus kiadványa, DE Informatikai Kar, Debrecen, 2008.

Definiens eCognition: [16] Definiens eCognition Developer 8, Reference Book, Definiens AG, München,

2009. [17] Definiens eCognition Developer 8, User Guide, Definiens AG, München, 2009. Saját munkák: [18] Gizella Nádor, Bernadett Csonka, Dávid Gera, Irén Hubik, Katalin Ócsai,

Zsuzsanna Suba, György Surek, Grácia Linda Tóth, Cecília Török: RAGWEED IDENTIFICATION BY WORLDVIEW2 DATA. Submitted for The DigitalGlobe 8-Band Research Challenge, 2010.

[19] Gizella Nádor, Bernadett Csonka, Dávid Gera, Irén Hubik, Katalin Ócsai,

Zsuzsanna Suba, György Surek, Grácia Linda Tóth, Cecília Török: TOXIC SPILL IN HUNGARY ON 4TH OCTOBER, 2010. Submitted for The DigitalGlobe 8-Band Research Challenge, 2010.

[20] Gábor CSORNAI, István LÁSZLÓ, Gábor MIKUS, Gizella NÁDOR, Irén

HUBIK, Katalin LIPTÁK, Mónika ANTAL, Katalin ÓCSAI, István FEKETE and Dávid GERA: The Possibilities of New Satellite Image Types in the Control of Area-based Subsidies and in Ragweed Monitoring System. 30th EARSeL Symposium "Remote Sensing for Science, Education, and Natural and Cultural Heritage", UNESCO, Paris, 31 May - 4 June 2010. -- Proceedings of EARSeL Symposium 2010, ISBN 978-3-00-033435-1,

- 84 -

[21] István László, Katalin Ócsai, Dávid Gera, Roberto Giachetta, István Fekete: Object-based Image Analysis of Pasture with Trees and Red Mud Spill. 31th EARSeL Symposium, Prague, Czech, 30 May – 2 June 2011. (Benyújtott előadás)

[22] György Surek, Gizella Nádor, Zsuzsanna Suba, Irén Hubik, Katalin Ócsai, Dávid

Gera, Cecilia Török, Grácia Linda Tóth: Comparative study of applications of satellite images with different spectral and spatial resolutions – three case studies (ragweed, toxic spill, waterlog). Three case study: ragweed, toxic spill and waterlog 31th EARSeL Symposium, Prague, Czech, 30 May – 2 June 2011. (Benyújtott előadás)

Download - Szegmentáló algoritmusok légi- és · változáskövetésre (pl. városok terjeszkedése). Jelen dolgozatban els ősorban mez őgazdasági, és a mez őgazdasághoz kapcsolódó

Top Related