Eötvös Loránd Tudományegyetem Informatikai Kar Algoritmusok és Alkalmazásaik Tanszék
Szegmentáló algoritmusok légi- és
űrfelvételek osztályozásában
Diplomamunka
Készítette:
Gera Dávid Ákos programtervező matematikus szak
nappali tagozat
Témavezetők:
Dr. Fekete István László István egyetemi docens osztályvezető
ELTE Informatikai Kar Földmérési és Távérzékelési Intézet
Budapest 2011
A projekt az Európai Unió támogatásával, az Európai Szociális Alap társfinanszírozásával valósul meg (a támogatás száma TÁMOP 4.2.1./B-09/1/KMR-2010-0003).
Tartalomjegyzék 1. Bevezetés ...................................................................................................................... 3 2. A távérzékelés alapjai................................................................................................. 6
2. 1. Fizikai alapok........................................................................................................ 7 2. 2. Felvételkészítés..................................................................................................... 9 2. 3. Előfeldolgozás .................................................................................................... 11
3. A távérzékelt felvételek kiértékelése ....................................................................... 13 3. 1. Intenzitástér......................................................................................................... 14 3. 2. Klaszterezés ........................................................................................................ 14 3. 3. Felügyelt osztályozás.......................................................................................... 15 3. 4. Maximum-likelihood módszer............................................................................ 16 3. 5. Távolságfüggvények........................................................................................... 17
4. Szegmensalapú képfeldolgozás ................................................................................ 18 4. 1. A textúra ............................................................................................................. 18 4. 2. Szegmensalapú osztályozás ................................................................................ 20 4. 3. Objektum alapú képelemzés ............................................................................... 21
5. Szegmentáló eljárások .............................................................................................. 23 5. 1. A szegmentáló eljárások áttekintése ................................................................... 23
5. 1. 1. Hisztogram alapú szegmentálás.................................................................. 23 5. 1. 2. Él alapú szegmentálás................................................................................. 25 5. 1. 3. Régió-alapú szegmentálás........................................................................... 26 5. 1. 4. A szegmentálás, mint gráfelméleti probléma............................................. 27
5. 2. Összevonás-alapú szegmentálás ......................................................................... 27 5. 2. 1. Szekvenciális csatolás................................................................................. 27 5. 2. 2. Legjobb összevonás .................................................................................... 29 5. 2. 3. Gráf alapú összevonás ................................................................................ 30
5. 3. Vágás-alapú szegmentálás .................................................................................. 31 5. 3. 1. Minimális átlagsúly alapú vágás................................................................. 31 5. 3. 2. Minimális arány alapú vágás ...................................................................... 33 5. 3. 3. Normált minimális vágás ............................................................................ 34
6. Gyakorlati feladatok megoldása a Definiens eCognition programrendszerrel .. 36 6. 1. Gyakorlati alkalmazások..................................................................................... 36 6. 2. A Definiens eCognition programrendszerről...................................................... 37 6. 3. Az eCognition szegmentáló eljárásai.................................................................. 38 6. 4. Osztályozás végrehajtása .................................................................................... 46
7. Fák lehatárolása (MePAR felújítás)........................................................................ 48 7. 1. A felhasznált felvételek ...................................................................................... 49 7. 2. A feldolgozás folyamata ..................................................................................... 49 7. 3. Szegmentálás ...................................................................................................... 50 7. 4. Osztályozás ......................................................................................................... 54 7. 5. Utófeldolgozás .................................................................................................... 59 7. 6. Pontosság ............................................................................................................ 60 7. 7. Javítási lehetőségek............................................................................................. 61
8. Vörösiszap-elöntés (katasztrófa-felmérés).............................................................. 62 8. 1. A felhasznált felvételek ...................................................................................... 62 8. 2. A feldolgozás folyamata ..................................................................................... 63 8. 3. Spektrális indexek............................................................................................... 63 8. 4. Szegmentálás ...................................................................................................... 64
8. 5. Osztályozás ......................................................................................................... 67 8. 6. Pontosság ............................................................................................................ 69 8. 7. A RapidEye felvétel feldolgozása, összehasonlítás............................................ 69
8. 7. 1. A RapidEye felvétel szegmentálása............................................................69 8. 7. 2. A RapidEye felvétel osztályozása............................................................... 70
9. Parlagfű kimutatás objektum alapon ..................................................................... 74 9. 1. Felhasznált felvételek ......................................................................................... 74 9. 2. A feldolgozás folyamata ..................................................................................... 75 9. 3. Szegmentálás ...................................................................................................... 75 9. 4. Osztályozás ......................................................................................................... 76 9. 5. Pontosság ............................................................................................................ 77
10. Összegzés.................................................................................................................. 79 A. Függelék .................................................................................................................... 80
A. 1. Adatszerkezetek ................................................................................................. 80 Éllistás gráfreprezentáció........................................................................................ 80 Bináris kupac .......................................................................................................... 80
A. 2. Négyfa alapú szegmentálás................................................................................ 81 Irodalomjegyzék............................................................................................................ 82
- 3 -
1. Bevezetés
A bevezető fejezetben röviden összefoglalom azokat az általános ismereteket, amelyek
diplomamunkám jobb megértéséhez szükségesek.
A távérzékelés, mint a térinformatika speciális része egyetemi tanulmányai során
keltette fel érdeklődésemet. A térképek iránti érdeklődésem gyermekkorom óta megvan,
így a térképek és az informatika kapcsolódása, a térinformatika irányába való
fogékonyságom is természetes. Ez az érdeklődés a Térinformatikai sáv keretében
tanulmányaimban is fontos helyet kaphatott. Döntésem helyességét a sáv tantárgyai
megerősítették, a Távérzékelt Felvételek Elemzése kurzusban pedig megtaláltam azt a
szűkebb szakmai irányvonalat, melyet követni szeretnék. Ennek a specializált
érdeklődésnek megfelelően kooperatív képzésre jelentkeztem a Földmérési és
Távérzékelési Intézetbe (FÖMI), a Távérzékelési Igazgatóságra (TÁI). A képzés után az
Intézet részmunkaidős munkatársa maradtam.
Diplomamunkám témáját is meghatározta ez a körülmény. A FÖMI-ben olyan
feladatokat kaptam, amelyek illeszkednek az ELTE IK – FÖMI TÁI közötti
együttműködés keretében több éve folyó kutatáshoz. A közös kutatás témája a
távérzékelt felvételek szegmentálási módszereinek, és a felvételek szegmensalapú
kiértékelésének a vizsgálata. Az együttműködés eddigi eredményeit (fejlesztéseket és
publikációkat) a dolgozat 4. fejezetében részletesen ismertetem.
A FÖMI-ben végzett munkáim közül három olyan feladat is szerepel, amelyek
megoldásban a felvételek szegmentálását kellett, illetve lehetett alkalmazni. A
szegmentálás a Definiens eCognition objektum-alapú képfeldolgozó program-rendszer
felhasználásával történt. A szegmentálás és az annak eredményére épülő objektum-
alapú elemzés kulcslépése a széleskörű paraméterezési lehetőségek megfelelő
kihasználása, ami az alkalmazást nagyon hatékonnyá teheti, ugyanakkor komoly
nehézségek forrása is lehet a rendszer érzékenysége a paraméterek helyes
megválasztására. A helyes alkalmazáshoz nélkülözhetetlen az emberi szakértelem,
- 4 -
amely egyaránt kiterjed a felvételek interpretációjára és a szegmentáló eljárások
működésére.
A FÖMI egyik legfontosabb, legnagyobb emberi erőforrásokat igénylő feladata a
mezőgazdasági támogatási rendszert felügyelő Mezőgazdasági Parcella Azonosító
Rendszer (MePAR) üzemeltetése és folyamatos felújítása. A bemutatott első alkalmazás
célja a rendszerben legelőként támogatható területeken megjelenő fás, bokros területek
légifelvételeken történő lehatárolása. A feladat jellege szükségessé teszi a szegmens
(objektum) alapú megközelítést. A bemutatott alkalmazás egy összetett térinformatikai
folyamat része, melynek célja a lehatárolás automatizálása.
A távérzékelés egyik legnagyobb erőssége a légi- és űrfelvételeken is látható
környezeti és ipari katasztrófák gyors és érintkezésmentes felmérésének és elemzésének
lehetősége. A FÖMI-ben rendszeres feladatok az ár- és belvízfelmérés, aszályfelmérés,
vagy például valamilyen mezőgazdasági kártevő kártételének vizsgálata. A másodikként
bemutatott alkalmazás azonban egy egyedi esemény, a 2010 októberében bekövetkezett
vörösiszap-elöntés hatását mérte fel. Ezen vizsgálatok keretében – elsősorban kutató
jellegű – szegmensalapú elemzéseket végeztem szuperfelbontású űrfelvételeken.
Minden évben ismétlődő fontos feladata az Intézetnek a parlagfű-fertőzöttség
elleni közérdekű védekezés támogatása távérzékeléses módszerrel. A hagyományosan
alkalmazott terepi ellenőrzésekkel megerősített idősor-alapú módszer mellett a 2010-es
évben egy a szuperfelbontású felvételek feldolgozási lehetőségeire irányuló kutatási
folyamat részeként az ilyen felvételek parlagfű-kimutatásra való alkalmasságát is
megvizsgáltuk. Ennek a folyamatnak része a harmadik gyakorlati alkalmazásként a 9.
fejezetben bemutatott általam végzett objektum-alapú feldolgozás.
Diplomamunkám felépítése a következő. A 2-3. fejezetben nagyon röviden
összefoglalom a távérzékelés (tanult) alapjait, az alkalmazott tartományra (passzív
távérzékelés az optikai tartományban) szűkítve. A 4-5. fejezetben áttekintem a
felvételek szegmentálásának és a szegmensalapú kiértékelésének módszereit, különös
tekintettel az ELTE-FÖMI közös kutatás eredményeire. A 6-7-8-9. fejezetekben
bemutatom a fenti három alkalmazást és az alkalmazott programrendszert. Végül, a 10.
fejezetben a dolgozat összegzése olvasható. Az Irodalomjegyzésben – tematikus
- 5 -
csoportosításban – csak olyan források szerepelnek, amelyeket a dolgozat megírásában
felhasználtam, hivatkozás azonban a szövegben nem történik rájuk.
A bemutatott alkalmazások a leírtaknál összetettebb, komplex feladatok részei, e
feladatokról – melyek csapatmunka eredményei – több társszerzős publikációban
(három angol, egy magyar nyelvű cikk, egy poszter, két előadás) számoltam be.
- 6 -
2. A távérzékelés alapjai
A távérzékelés elektromágneses hullámok rögzítését és az így nyert információrendszer
feldolgozását jelenti. A vizsgálat tárgya általában a föld- és a vízfelszín, a növénytakaró
és a talaj felső rétegei. A érzékelő műszer nincs közvetlen kapcsolatban a vizsgálat
tárgyával, általában repülőgépen, vagy műholdon elhelyezett szenzor, de léteznek
eszközök, melyek csupán a felszín felett néhány méterrel dolgoznak. A levegőből vagy
a világűrből történő felvételezés lehetővé teszi nagy területek átfogó vizsgálatát,
továbbá a terepi viszonyok, a célterület megközelíthetetlensége nem nehezítik az
elemzést. A mért elektromágneses sugárzás forrása lehet a Nap, az érzékelő műszer,
vagy maga a vizsgált objektum is. Az első két esetben a felszín által visszavert sugárzást
mérjük. Ez esetben megkülönböztetünk passzív, illetve aktív távérzékelést. Passzív
rendszer esetén a sugárzás forrása a Nap, a mért hullámhossz-tartomány az optikai
tartomány egy része. Aktív rendszer esetén a sugárzás forrása maga a mérőeszköz, a
mért hullámhossz a mikrohullámú tartományba esik. A nyert adatok általában képszerű,
többsávos felvétel formájában kerülnek feldolgozásra. A távérzékelt felvétel
kiértékelése a felvételezett objektumok, folyamatok paramétereinek matematikai alapon
történő meghatározását jelenti, a kiértékelés eredménye általában a kiértékelési
szempontok szerinti kategóriákat tartalmazó tematikus térkép. A felszíni objektumok
tematikus kategóriákba sorolása az osztályozás.
1. ábra: légifelvétel és tematikus térképe
- 7 -
Természetesen a távérzékelés első alkalmazása is katonai célokkal történt. A civil
felhasználásra a környezeti erőforrás-kutatás hatékonyságának növekvő jelentősége
adott lehetőséget. Napjainkban a távérzékelést alkalmazzák mezőgazdasági,
környezetvédelmi célokkal, természeti katasztrófák hatásának vizsgálatára,
változáskövetésre (pl. városok terjeszkedése). Jelen dolgozatban elsősorban
mezőgazdasági, és a mezőgazdasághoz kapcsolódó katasztrófavédelmi (a 2010 őszén
történt vörösiszap elöntés) alkalmazásokról lesz szó.
A távérzékeléses elemzés átfogó mivolta és terepfüggetlensége mellett további
előnye a gyorsasága, és a képi jellegű adatok feldolgozhatósága, valamint relatív
olcsósága. Ugyanakkor megemlítendő nehézséget jelent a leggyakrabban használt,
optikai tartományban történő felvételezés időjárás-függősége, a felvételek
kiértékelésének rendszer-, és szakember-igénye, illetve a kiértékelés pontosságának
kérdése.
2. 1. Fizikai alapok
A már említett passzív és aktív távérzékelési rendszerek közül a továbbiakban
csak a passzív rendszerrel foglalkozunk. E rendszereknél az érzékelt elektromágneses
hullámok forrása általában a Nap, a szenzor a felszínről visszavert sugárzást rögzíti. A
passzív távérzékelésben használt hullámhossz-tartomány jellemzően a 0.3 - 15µm
közötti, úgynevezett optikai tartomány.
2. ábra: az optikai hullámhossz-tartomány részei
- 8 -
A mezőgazdasági távérzékelés elsősorban az optikai tartomány látható, közeli és
közepes infravörös részét használja. A passzív távérzékelés időjárás-függő módszer, a
felszínről kiértékelhető felvétel csak nappal és tiszta időben készíthető, továbbá
figyelembe kell venni az optikai tartomány légköri vízelnyelési sávjait, azaz azon
hullámhossz-tartományokat, ahol a légkörben lévő víz a sugárzást elnyeli. A szenzorok
ezen intervallumokban nem felvételeznek. Fontos fizikai tényezők továbbá a Nap állása,
és a légköri szórás, melyek befolyásolják a készített felvételt. E hatások
kiküszöbölésére, különösen több felvétel együttes kiértékelésénél fontos a légköri
korrekció, az ún. Top-of-the-Atmosphere (ToA) reflektanciakép előállítása. (az ehhez
szükséges adatok a felvétellel együtt elérhetőek).
A reflektancia függvény: a hullámhossz tartományban a visszavert sugárzási érték
a különböző felszíni objektumokra jellemző görbét ír le. Ez alapján elkülöníthető
felszínborítások például a vízfelület, különböző talajtípusok, zöld növényzet.
3. ábra: jellemző reflektanciagörbék
Az ábrán látható a zöld növényzetre jellemző reflektancia görbe összetettsége. A
látható hullámhossz-tartomány visszaverési minimumait a klorofill-elnyelés, a közepes
infravörös tartomány minimumait a növény víztartalma okozza. Ezekből az adott
növénytípus fejlettségi szintjére, egészségességére is következtethetünk. A görbe a
növény fejlődésének különböző szakaszaiban jellemző módon változik. Hasonló módon
a különböző talajok tulajdonságai is leolvashatóak. Az egymáshoz spektrálisan nagyon
- 9 -
hasonló növénytípusok elkülönítéséhez a felvételezés időpontja, több időpontban
készült felvétel együttes elemzése (idősor) ad segítséget.
Az egyes felszíni objektumok egyértelmű azonosítása ugyanakkor nem lehetséges
a reflektancia görbék alapján, ugyanis a mért értékeket technikai (pl. felbontás) és
környezeti tényezők (pl. az objektum állapota, környezetében található más felszíni
objektumok) erősen befolyásolják.
2. 2. Felvételkészítés
A felvételeket többféle fizikai mértékkel jellemezhetjük. A spektrális felbontás a
felvételezhető hullámhossz-tartomány szélességét és részletességét jellemzi. A térbeli
felbontás az egy képpontra eső felszín területét adja meg. Műholdakon elhelyezett
szenzoroknál további fontos jellemzők a visszatérési idő – azaz a műhold milyen
gyakran halad át ugyanazon földi pont felett, illetve az egy felvétellel lefedhető terület
nagysága.
A felvételkészítő eszköz hordozója általában repülőgép, vagy műhold. Az optikai
tartományban működő passzív rendszerek két fő típusa a fényképező típusú és digitális
pásztázó letapogató rendszer.
Az analóg és digitális fényképező rendszerek a látható és a közeli infravörös sáv
egy részét használják (kb. 0,4 – 0,9 µm). A szenzor a teljes felvételezendő területet
egyszerre rögzíti. Fontos szerepe van a színes infravörös (CIR – color infra red)
felvételeknek, a dolgozatban bemutatott egyik gyakorlati alkalmazás bemenő adatai is
CIR orthokorrigált (térképhelyes) légifelvételek. Ezen rendszereket általában
repülőgépek hordozzák, a felvételekre gyenge spektrális felbontás mellett nagyon jó
térbeli felbontás jellemző.
A többsávos digitális pásztázó letapogatók elsősorban műholdak fedélzetén
működnek. A szenzor a földfelszín repülésre merőleges sávjáról érkező
elektromágneses sugárzás-intenzitást rögzíti, a teljes felvétel e sávokból áll össze. Az
így készült digitális felvétel egy mátrix, melyet soronként tölt fel a szenzor. Az egyes
- 10 -
mátrixértékek (a pixelek) vektorok, melyek dimenziószámát a felvételnél használt sávok
száma adja. A digitális felvételek a fényképező rendszereknél nagyobb spektrális
felbontást tesznek lehetővé, térbeli felbontásuk a kis felbontású (1100m) elsősorban
meteorológiai célú eszközöktől a nagyon nagy felbontásúig (akár 0,5m) terjed.
A mezőgazdasági távérzékelésben elsősorban nagyfelbontású (HR - High
Resolution) és nagyon nagy-, vagy más néven szuperfelbontású (VHR - Very High
Resolution) felvételeket alkalmazunk, a jelen dolgozatban leírt módszerek és
alkalmazások is ilyen típusú felvételeken használhatóak. HR felbontású felvételeket
szolgáltatnak például az Awifs (60m-es térbeli felbontás), a Liss (20m), a SPOT (20m
illetve 10m) és a Landsat TM (25m) szenzorok, VHR felbontásúak például a RapidEye
(5m), és a WorldView2 (2m), az orthofotók szintén VHR felbontásúak.
A felvételek feldolgozása a szükséges geometriai és radiometriai korrekciók
elvégzése után számítógépes úton, a digitális képelemzés módszereivel történik. Az
optikai tartományban jellemzően használt sávok a látható zöld és vörös, valamint a
közeli és közepes infravörös hullámhossz-tartomány egyes részei. Egyes szenzorok
felvételeznek az optikai kék tartományban, vagy a vörös és közeli infravörös sáv
határán, az ún. „red edge” (vörös-határ) sávban.
A felvételkészítés során a szenzor a felszíni objektumok reflektanciafüggvényét
az egyes sávoknak megfelelő hullámhossz-intervallumokban mintavételezi, majd
kvantálja. A kvantálás finomsága szintén fontos jellemzője az egyes felvételkészítő
eszközöknek.
Egyes szenzorok alkalmasak ún. pankromatikus felvétel készítésére is, ekkor a
felvételezés általában a látható kék – vörös-határ tartományban történik, egy sávon, a
multispektrális (nem pankromatikus) felvételezésnél nagyobb térbeli felbontással és
finomabb kvantálással.
A többsávos távérzékelt felvételek képként való megjelenítésekor ki kell
választani a megjelenítendő sávokat, és hozzárendelni azokat a megjelenítő eszköz
(vörös, zöld és kék) színpuskáihoz. Az így megjelenített képet kompozitnak nevezzük.
Gyakran alkalmazott a valódi színes kompozit, ami a természetes megjelenítésnek felel
- 11 -
meg, vagyis a felvétel vörös, zöld és kék komponensét rendre a megjelenítő vörös, zöld
és kék színpuskájához rendeljük. Szintén sokszor előfordulnak az ún. hamisszínes
kompozitok, amikor a megjelenítő vörös, zöld, kék színpuskáihoz rendre a felvétel
közeli infravörös, vörös és zöld, vagy közeli infravörös, közepes infravörös, vörös
sávjait rendeljük. Hamis színes kompozitokon a növénytakaró jellegzetes vörös színben
látszik.
2. 3. Előfeldolgozás
Már említettük, hogy az elkészült felvételt a légkör állapota, a Nap állása
befolyásolja. E mellett a felvételt számos további hiba terheli. Ezek egy része
geometriai hiba, melyeket a műhold mozgása, a Föld forgása és a nagy látószögből
valamint a felszín görbületéből adódó torzítás okoz. A durva geometriai hibák
korrekcióját a felvevő rendszer (a földi vevőállomáson) elvégzi. További szükséges
geometriai korrekció a felvétel vetületi rendszerbe transzfomálása, melyet
referenciapontok alapján, vagy vetületi rendszerek közötti transzformációs
függvényekkel végeznek. Természetesen az utóbbi módon csak már valamilyen
vetületben lévő felvétel transzformálható. Magyarországon általában az Egységes
Országos Vetületi Rendszert (EOV) használjuk.
A geometriai mellett adódnak radiometriai hibák is. Ezek egy részének
kiküszöbölését szolgálja a már említett ToA reflektancia előállítása. További,
elsősorban a vizuális kiértékelést segítő korrekciók a digitális képfeldolgozásból ismert
hisztogram-műveletek, élesítés, konvolúciós szűrések. Míg a ToA reflektancia
előállítása elengedhetetlen a további feldolgozáshoz, a képi látványt javító műveletek
oly módon változtatják meg a képet, hogy utána nem alkalmazhatjuk a képanalízis
egyes lépéseit.
A radiometriai hibák javítása mellett a további feldolgozásban is szükség van az
elemi képstatisztikák kiszámítására. Ezek egyrészt a sávonkénti statisztikák (átlag,
intervallum, szórás, hisztogram), valamint a több sáv együttes viselkedését leíró
kovariancia és korrelációs mátrix. A spektrális indexek szintén fontos elemei a
feldolgozásnak. Ezek több sáv pixelenkénti értékeiből számolt újabb képrétegek. A
- 12 -
leggyakrabban használt index az NDVI (Normalized Difference Vegetation Index –
vegetációs index), mely a közeli infravörös (NIR) és a látható vörös (R) sávokból, a
következő képlettel adódik: NDVI = (NIR-R)/(NIR+R), ennek értéke a [-1, 1]
intervallumba esik. A vegetációs index a zöld (fotoszintetizáló) növényzetre jellemző
spektrális tulajdonságot (magas visszaverés a közeli infravörös, alacsony a látható vörös
tartományban) emeli ki. Hasonló módon más sávokból is képezetők spektrális indexek.
- 13 -
3. A távérzékelt felvételek kiértékelése
A szükséges előfeldolgozási műveletek után a felvétel alkalmas a tényleges
kiértékelésre. A kiértékelés célja a felszínborítási elemek minél több
állapothatározójának pontos, megbízható becslése, és ezek alapján a célkategóriák
tematikus térképének előállítása. E célkategóriákat az elvégzendő feladat határozza
meg. Ezek lehetnek különböző haszonnövények, talajtípusok, katasztrófa-felmérésnél
(pl. belvíz) érintettségi fokozatok. A tematikus térkép elkészítése minden egyes képpont
(pixel) valamely kategóriába sorolását jelenti, a lehető legkisebb hiba mellett. A
térképet előállító eljárástól elvárt a megfelelő (és igazolható) pontosság, gyorsaság és
ismételhetőség.
A kiértékelés alapmódszerei a vizuális értelmezés és a digitális képelemzés. Az
eljárás általában komplex, mindkét módszer elemeit használja, az adott feladat
függvényében. A vizuális kiértékeléssel szemben a számítógépes feldolgozástól
természetes elvárás a gyorsaság, a nagy adatmennyiségek együttes hatékony kezelése,
ezek mellett a tónusbeli különbségek (az emberi szem még a könnyebben elválasztható
színekben is csak 8-10 árnyalatot képes megkülönböztetni) és a textúrák mérésében is
erősebb. Ugyanakkor nem elhanyagolandó, hogy a megfelelő szaktudású személy által
végzett vizuális interpretáció a geometriai összefüggések, textúrák felismerésében jóval
hatékonyabb a számítógépes kiértékelésnél. A kiértékelő módszer tudományosan
megalapozott kell legyen, a folyamatnak csak egy része a felvétel készítése (beszerzése)
és feldolgozása. Még ezek előtt szükséges a célok pontos meghatározása, és a fizikai,
adat és megoldási modellek létrehozása. Az adatgyűjtést is megfelelően alaposan kell
elvégezni, egyes feladatokban terepi adatgyűjtésre is szükség lehet.
Ezek után a tematikus térkép elkészítésének fő lépése az osztályozás. Az
osztályozás során minden egyes képpont besorolást nyer valamely – pontosan egy
tematikus osztályba. A célosztályok mellett használunk egy ún. „egyéb” kategóriát is, a
semelyik célosztálynak sem megfelelő képpontok számára.
- 14 -
A felvételezett sugárzási kép visszaszámítása földi paraméterekre lehetetlen, az
osztályozás statisztikai döntéselméleti módszerekkel végezhető. Alkalmazunk
felügyelet nélküli és felügyelt osztályozást. A klaszterező eljárások felügyelet nélküli
osztályozást valósítanak meg. Ezek bemutatása előtt definiáljuk az intenzitástér
fogalmát.
3. 1. Intenzitástér
A felvétel a képtérben természetes módon jelenik meg. A tengelyek a térbeli
(síkbeli) koordináták, a tér elemei intenzitásvektorok. Ugyanakkor a felvétel
ábrázolható az intenzitástérben is, ahol a koordináta-tengelyek az egyes spektrális
sávok, az értékek pedig az adott intenzitású pontok száma. A hisztogramhoz hasonlóan
az intenzitástér is független az egyes képpontok térbeli elhelyezkedésétől, azaz a
felvétel pixeljeit a képtérben tetszőlegesen permutálva az intenzitástérben nem változik
meg. Az intenzitástér dimenziója a kép spektrális sávjainak száma, ábrázolása
értelemszerűen két (vagy három) sáv felhasználásával történik. Az intenzitástérben az
egyes sávokra jellemző viselkedés mellett az „együttmozgások”, vagyis a különböző
sávok értékei közötti összefüggések is megfigyelhetőek. Az azonos felszíni objektumok
képpontjai az intenzitástérben jellemző csoportokat alkotnak.
4. ábra: Landsat TM felvétel az intenzitástérben
3. 2. Klaszterezés
Az intenzitástérben az egyes tematikus osztályok pixelei csoportosulnak, és e
csoportok elkülönülnek egymástól. Ilyen adatcsoportosulások egy kategórián belül is
- 15 -
előfordulhatnak, illetve előfordulhat olyan csoport, amelynek elemei nem egy tematikus
kategóriához tartoznak.
Az adatcsoportosulások neve spektrális adatosztály, röviden klaszter (cluster). A
klaszterező eljárás az intenzitásteret bontja fel diszjunkt adatcsoportosulásokra, azaz
minden képponthoz hozzárendel pontosan egy osztályt. Természetesen ezek az
osztályok nem, vagy csak részben felelnek meg a tematikus kategóriáknak, a kapott
klasztertérkép tekinthető spektrális sugárzási térképnek. Az eljárás felügyelet nélküli,
ugyanis a klaszterek lehatárolása matematikai úton, előzetes információk (pl.
tanulóterület) felhasználása nélkül történik.
Egy klaszterező eljárás az ISODATA klaszter-kereső algoritmus leegyszerűsítve:
1. első lépésben kiválasztunk megfelelő számú klaszterközéppontot (pl. az
intenzitástérben egyenletesen)
2. minden képpontot besorolunk a hozzá legközelebbi klaszterhez
3. meghatározzuk az új középpontokat (a klaszterbe tartozó képpontok
átlagvektora)
4. megvizsgáljuk a klaszterek változását, ha ez „nagy”, akkor vissza a 2. pontra,
különben
5. kialakultak a klaszterek
A képpontok távolságának meghatározása legkisebb négyzetek módszerével
történik. Ez adott darabszámú ci klaszter mellett a következő érték minimalizálását
jelenti:
∑∑∈
−i ic cx
icx 2)(
Az eljárás alkalmazásakor megszorítás tehető a méretre, elemszámra, lehetőséget
adhatunk közeli klaszterek összevonására, túl nagy klaszter szétvágására.
3. 3. Felügyelt osztályozás
A módszer alapja a célkategóriák rendelkezésre álló (pl. terepi felmérésből)
reprezentatív mintája. Ezeket a mintákat kategóriánként két diszjunkt halmazba sorolva
kapjuk az ún. tanuló- és tesztterületeket. Feltételezve az azonos tematikus kategóriába
- 16 -
tartozó objektumok spektrális hasonlóságát, a kategóriák tanulóterületen való spektrális
viselkedéséből megkapjuk a felvétel egészének osztályozását. A kapott eredmény a
tesztterület alapján ellenőrizhető, nem megfelelő eredmény esetén paraméterek
megváltoztatásával javíthatunk a kiértékelésen.
Az egyes képpontok besorolására gyakran alkalmazott a becsléselméletből ismert
maximum-likelihood döntés, de létezik különböző távolságfüggvényeket használó,
valamint mesterséges neuronhálókon alapuló osztályozási eljárás is.
A felügyelt osztályozás pontossága vizsgálható a tévesztési mátrix segítségével. A
mátrix sorait az osztályozás során kapott értékekből, oszlopait a referencia-adatokból
(teszt-területek, referenciatérkép) kapjuk. A különböző kategóriába tartozó elemek közt
előforduló spektrális átfedések miatt a „legpontosabb” osztályozási folyamatban is
előfordul hibás döntés egyes képpontokról. A hibaelemzést mindig az adott feladat
függvényében kell végezni, megkülönböztetve az első és másodfajú hibákat. A hibák
statisztikai leírására szolgáló tévesztési mátrix mellett a térbeli jellemzésre hibatérkép
készíthető.
3. 4. Maximum-likelihood módszer
Az egyes kategóriák az intenzitástérben nem pontszerűen vannak jelen, spektrális
értékeik az előfordulási valószínűségi értékekkel jellemezhetők. Ezt a valószínűséget a
tanulóterületről vett értékek definiálják. Az ismeretlen hovatartozású képpont abba az
osztályba kerül, amely osztályhoz a legnagyobb valószínűséggel tartozik. Az egyes
kategóriák átfedései miatt az osztályozás nem hibamentes, ugyanakkor belátható, hogy
a maximum-likelihood módszer optimális a hibák valószínűsége szempontjából.
Gyakran szükség van az osztályozási hibák súlyozására, ehhez készíthető
veszteségmátrix, melyben a téves osztályozásokhoz rendelhetünk hibasúly-értékeket. A
veszteségi mátrix figyelembe vételével zajló maximum-likelihood döntés elnevezése
Bayes-osztályozás, ekkor a hibákból származó összes veszteséget kívánjuk
minimalizálni.
- 17 -
5. ábra: sűrűségfüggvények átfedése - az osztályozási hibák forrása
3. 5. Távolságfüggvények
Az osztályozási folyamat befolyásolható a képpontok vagy osztályok
távolságának definiálása. A legkisebb négyzetek módszerét a felügyelet nélküli
osztályozásnál már említettem. Osztályok távolságát sűrűségfüggvényük átfedésével
mérhetjük. Ilyen távolságfüggvény a divergencia:
∫ −=x j
iji dx
xp
xpxpxpjiD
)|(
)|(ln))|()|((),(
ωωωω
ahol ωi és ωj az osztályok sűrűségfüggvényei, )|( ixp ω pedig az x elem i. osztályba
való tartozásának valószínűsége. Hasonló mértékek a Jeffries-Matusita távolság:
∫ −=x
ji dxxpxpjiJ 2))|()|((),( ωω
és a Bhattacharrya távolság:
∫=x
ji dxxpxpjiB )|()|(),( ωω
- 18 -
4. Szegmensalapú képfeldolgozás
A pixel-alapú osztályozás gyakori hibája a képpont önmagában, környezetétől
függetlenül való vizsgálatából ered. Jellemzően egy homogén felszínborítás egyes
pontjai az átlagtól eltérhetnek, emiatt az ilyen pixelek más kategóriába nyerhetnek
besorolást, mint ahova környezetével együtt valójában tartozik. További problémát
jelent, hogy szuperfelbontású felvételek esetén a képi egység kisebb lehet, mint a
tematikus kategória egységei, azaz a felvételen egy objektum több, önmagukban
helyesen nem értelmezhető képpontból épül fel.
A pixel-alapon végzett osztályozás az egyes képpontoknak csak a spektrális
tulajdonságai alapján történik. Ugyanakkor a felvételek alkalmasak környezeti
viszonyok, geometriai tulajdonságok, texturális mértékek figyelembe vételére is. Ahogy
említettük, a geometriai összefüggések és texturális jellegzetességek felismerésében a
számítógépes kiértékelésnél hatékonyabb a vizuális interpretáció.
4. 1. A textúra
A textúra (mintázat) a képpont környezetének szabályos intenzitásváltozása.
Létezik determinisztikus és sztochasztikus textúra. A determinisztikus textúrák szigorú
szabályok szerint ismétlődő mintákból állnak, ilyen például egy sakktábla mintázata. A
sztochasztikus textúrát valamilyen statisztikai törvényszerűség határozza meg, ilyenek
például a szomszédos, azonos felszíni objektumot alkotó képpontokban kirajzolódó
mintázatok (elsősorban HR és VHR felbontásban).
A textúra mérésére többféle texturális mértéket használhatunk, melyek
megfogalmazása a pixelek közelében lévő többi képpont intenzitásával történik.
Mérhető a környezetben lévő azonos, vagy eltérő intenzitások gyakorisága. E mértékek
alapján vizsgálható szomszédos képpontok összetartozása vagy elkülönülése. Mérhető
tulajdonságok például a homogenitás, a véletlenszerűség.
- 19 -
A textúra mérésre gyakran használt technika a GLCM mátrixon (Grey Level Co-
occurence Matrix) alapuló mértékek használata. A GLCM-nek magyar elnevezése
nincs, szabadfordításban: szürkeárnyalatok együttváltozása (mátrix).
Nevével ellentétben bármely egész értékekből álló spektrális sávban számítható,
de a valamely sávhoz számított mátrix független a többi sáv értékétől. A GLCM mátrix
négyzetes, sor és oszlopszáma az adott sáv radiometriai felbontásával (kvantálási
szintek száma) egyezik meg. Legegyszerűbb esetben a mátrix (i, j) értékét úgy kapjuk
meg, hogy a szomszédos i-j képpont-párokat összeszámláljuk. Szomszédosság helyett
megadható egy pozitív egész d távolság, ekkor i és j képpontok távolsága d. Négy
irányban számolható GLCM mátrix: 0°, 45°, 90°, és 135°, azaz (i, j) esetben az i
képponthoz képest melyik szomszédos pixel (d > 1 esetben irány) adja a j pozíciót. A
párok összeszámlálása után a mátrixot a transzponáltjával összeadva szimmetrikussá
tesszük, majd az elemszámmal normalizáljuk.
6. ábra: a GLCM mátrix meghatározása
A GLCM mátrixból származtatható statisztikák jellemzik a textúrát. A statisztikák
a következők, ahol Pij a normalizált szimmetrikus GLCM mátrix (i, j) eleme, n a mátrix
sor vagy oszlopszáma:
Entrópia:
∑−
=
−1
0,
)ln(n
jijiij PP
a textúra rendezetlenségét, véletlenszerűségét méri.
- 20 -
Kontraszt:
∑−
=
−1
0,
2)(n
jiij jiP
a lokális különbségeket méri.
Homogenitás:
∑−
= −+
1
0,2)(1
n
ji
ij
ji
P
az elemek eloszlásának közelsége a GLCM főátlóbeli elemekhez. A homogenitás értéke
magas, ha a mátrixbeli értékes (nem nulla) elemek a főátló környezetében
csoportosulnak.
Korreláció: a szomszédos pixelek lineáris függősége. Képlete:
∑−
=
−−1
0,2
))((n
ji
ij jiP
σµµ
ahol µ a GLCM mátrixelemek átlaga, σ2 pedig a szórásnégyzete.
GLCM-alapú texturális mértékeket használhatunk a később bemutatásra kerülő
Definiens eCognition objektumalapú képfeldolgozó rendszerben is.
4. 2. Szegmensalapú osztályozás
Szegmensalapú osztályozás során bevezetünk egy, a pixeleknél nagyobb képi
egységet, a szemgenst. Röviden definiálva a szegmens: spektrálisan hasonló,
szomszédos képpontok egybefüggő halmaza. Természetesen egy felszínborítási
objektum több szegmensből is állhat. A szegmensek létrehozása az osztályozási
folyamat első lépése lesz, ennek eredménye a szegmenstérkép. Az osztályozás a
létrehozott szegmenseket sorolja be a tematikus kategóriákba. A szegmensalapú
osztályozás pontosabb lehet a pixel-alapúnál, ugyanakkor a paraméterezésre nagyon
érzékeny, továbbá a határpontok besorolásakor nem elég pontos, ez az eredmény
pixelenkénti felülvizsgálatával javítható.
- 21 -
A szegmentálás feladata tehát a kritériumoknak megfelelő szomszédos pixelek
összevonása. A szegmentálásnak többféle megközelítése létezik, ezek kombinálva is
alkalmazhatóak.
4. 3. Objektum alapú képelemzés
Az objektum alapú képelemzés (röviden OBIA – Object Based Image Analysis)
új megközelítés a képfeldolgozásban. Az objektum orientált paradigmához bár részben
kapcsolódik, a módszert objektum alapú (és nem objektum orientált) elnevezéssel
szokás jelölni. Az OBIA a pixel-alapú kiértékelés már ismertetett hiányosságainak és
korlátainak leküzdése érdekében, illetve a távérzékelt felvételek korábban ki nem
használt lehetőségeinek kiaknázása céljából alakult ki.
Említettem már, hogy a vizuális interpoláció, az emberi szem és agy a
képfeldolgozás egyes műveleteiben hatékonyabb a számítógépes feldolgozásnál. Az
emberi látás a geometriai összefüggéseket és textúrákat jóval hatékonyabban ismeri és
dolgozza fel, mint a számítógépes látás, mely minden egyes képpontot külön-külön,
vagy néhány pixeles környezetben értelmez. A képelemzés objektum alapú
megközelítésének célja az emberi látás hatékony modellezése, a számítógépi látás
gyorsaságát és mérési pontosságát kihasználva. Azonban meg kell említeni, hogy a
vizuális interpretáció eredménye sem mindig egyértelmű, így annak modellezése sem
zárja ki a hibák lehetőségét.
Míg a pixelalapú képelemzés az egyes képpontok által hordozott információkon
alapul, az objektumalapú elemzés egysége a képi objektum - hasonló képpontok
halmaza. Az objektumok lehetővé teszik a már említett geometriai és texturális
jellegzetességek mérését, alkalmazását az osztályozásban. Továbbá az objektumok
között kialakítható hierarchikus rendszer, felbonthatók al-objektumokra, összefoghatók
szuper-objektumba. Az osztályozásban e hierarchia is szerepet kaphat, illetve ha például
a felvétel egyes objektumai az elemzési feladat szempontjából érdektelenek, ezen
objektumok egy szuper-objektumba szervezve csökkentik a feldolgozandó
adatmennyiséget, erre a gyakorlati alkalmazásokban is láthatunk majd példát. A
geometriai jellemzők alkalmazásával azonos kategórián belüli alosztályokat
- 22 -
különböztethetünk meg, például vízfelületeket tó és folyó alkategóriákba sorolhatunk
(önmagában ez a döntés természetesen hibákat is eredményezhet), illetve minimális
objektumméret meghatározásával kiküszöbölhetők a lokális inhomogenitások okozta
téves osztályozások. Az objektum alapú elemzés eredménye vektoros formátumban áll
rendelkezésre, így térinformatikai rendszerekbe könnyen beilleszthető. Megemlítendő
ugyanakkor, hogy az OBIA nem egzakt módszer, a felkínált lehetőségek nehézségeket
is okozhatnak. A kívánt eredmény eléréséhez hosszadalmas paraméterezésre, tesztelésre
van szükség, továbbá ahogy ezt a későbbiekben bemutatom, a szuperfelbontású
felvételeken tapasztalható egyedi jelenségek miatt a kidolgozott osztályozó folyamatok
automatizálása nehezen megvalósítható.
Objektum alapú képelemzéshez szükségünk van objektumokra, melyek nem
állnak rendelkezésre, mint a felvételből a pixelértékekhez hasonló módon kinyerhető
adatok, azaz elő kell állítani őket. Az objektumok létrehozásának egyszerű módja a kép
szegmentálása. Így értelemszerűen egy felvétel objektumairól nem adható egzakt leírás,
hiszen a szegmentálás, és így az eredmény a feladat függvényében nagyon széleskörű
lehet, akár egyazon felvétel esetében is. A szegmentálás a felhasználható attribútumok
alkalmazhatóságát, az osztályozás eredményét jelentősen befolyásoló kulcslépés az
elemzésben. Az osztályozás elve megegyezik a képpont alapú osztályozáséval, az egyes
objektumokat a tulajdonságai alapján statisztikai döntésekkel valamely osztályba
soroljuk.
- 23 -
5. Szegmentáló eljárások
A szegmentálás alapgondolata és fontos alapfogalmai után a szegmentálás
végrehajtásának módjait mutatom be. Az algoritmusok felépítése mind a technika
(matematikai háttér), mind a felhasznált segédeszközök (pl. adatszerkezetek) igen
sokszínű. Értelemszerűen a kapott szegmenstérkép is sokféle lehet, ugyanakkor az
eltérő módszerek megfelelően paraméterezve hasonló eredményt adhatnak.
Megjegyzendő, hogy a szegmentálásnak nincs egzakt jó eredménye, az eredmény
minőségét a cél és a feldolgozandó felvétel adta lehetőségek határozzák meg.
5. 1. A szegmentáló eljárások áttekintése
A következőkben a szegmentáló algoritmusok három jelentősen eltérő
megközelítését mutatom be. A hisztogram és él alapú módszerek a digitális
képfeldolgozás más területein alkalmazott műveleteinek átfogalmazása, a módszerektől
várható eredmény távérzékelt felvételek szegmentálására nem megfelelő, ugyanakkor a
szegmentálás nem csak távérzékelt felvételek feldolgozására alkalmazható (hanem pl.
orvosi képelemzés), ezért röviden ezeket is bemutatom. A távérzékelés számára
megfelelő szegmentálást a harmadikként bemutatandó régió alapú módszerek adják. A
gyakorlatban alkalmazott szegmentálás általában az itt leírt algoritmusokból felépített
komplex eljárás.
5. 1. 1. Hisztogram alapú szegmentálás
A hisztogram alapú szegmentálás elve nagyon egyszerű, ugyanakkor a kapott
eredmény nem felel meg a szegmenstől definíció szerint várt fontos követelménynek, a
térbeli összefüggőségnek. Ettől a követelménytől távérzékelt felvételeknél,
térinformatikai alkalmazásokban nem tekinthetünk el, de például orvosi célú
képfeldolgozásban alkalmazható a hisztogram alapú szegmentálás. A módszer a
digitális képelemzésből ismert küszöbölés eljárását alkalmazza valamely spektrális
sávokra, statisztikai úton meghatároz egy vagy több küszöbértéket, melyek mentén a
- 24 -
felvételt több részre vágja (az egydimenziós intenzitástérben), a hasonló intenzitású
képpontok ugyanabba a kategóriába kerülnek. Alkalmazható globálisan, az egész képre,
vagy lokálisan, az egyes képrészletekre egymástól függetlenül végrehajtva. A cél lehet
egy küszöbérték meghatározása, ez a felvételezett objektum és a háttér szétválasztását
jelenti, és létezik többszintű, több határértéket meghatározó küszöbölés is. Az eredmény
„jóságát” a hisztogram alakja befolyásolja, értelmes küszöböléshez a hisztogramban jól
elkülönülő lokális maximumok szükségesek, ekkor az optimális érték e maximumok
közötti minimumhely.
Az egyik leggyakrabban alkalmazott módszer az Otsu-féle küszöbölés. Az eljárás
megfelelő alakú hisztogram mellett optimális eredményt ad, azaz a kapott küszöbnél
maximális a két osztály különbsége. Általában szürkeárnyalatos képeken alkalmazzuk,
de bármely spektrális sáv küszöbölhető ily módon. Első lépésben legyen P(i) a sáv (az
összes képpont számával) normalizált hisztogramja. Ennek átlaga és szórásnégyzete:
∑=
=max
0
)(G
i
iiPµ ∑=
−=max
0
22 )()(G
i
iPi µσ
ahol Gmax a lehetséges maximális intenzitásérték. A t küszöb két részre osztja a
hisztogramot, melyekre:
∑=
=t
i
iiPtq 01
1 )()(
1µ ∑=
−=t
i
iPitq 0
21
1
21 )()(
)(1 µσ
∑+=
=max
122 )(
)(
1 G
ti
iiPtq
µ ∑+=
−=max
1
22
2
22 )()(
)(1 G
ti
iPitq
µσ
ahol
∑=
=t
i
iPtq0
1 )()( ∑+=
=max
12 )()(
G
ti
iPtq 1)()( 21 =+ tqtq
Adott t érték mellett az osztályon belüli (2Wσ ) és az osztályok közötti (2Bσ )
szórásnégyzet:
)()()()()( 222
211
2 ttqttqtW σσσ +=
)()( 222 tt WB σσσ −=
Mivel a két szórásnégyzet összege konstans, ezért két ekvivalens lehetőség adott: az
optimális küszöb az a t érték, melyre )(2 tWσ minimális vagy )(2 tBσ maximális. Az
Otsu-eljárás általánosítható többszintű küszöbölésre.
- 25 -
5. 1. 2. Él alapú szegmentálás
A módszer a homogén területeket elválasztó élek alapján építi fel a szegmenseket.
Képi élnek a hirtelen intenzitás-változásokat tekintjük, azaz a szegmenshatárokat ezek
az intenzitásváltozások adják. Éldetektáláshoz használhatjuk a képanalízisben
alkalmazott Prewitt, Sobel, Canny, Laplace konvolúciós szűrőket (a Laplace-szűrő, bár
éldetektor, zajérzékenysége miatt nem alkalmazható távérzékelt felvételeken).
Az éldetektálás gyors művelet, megfelelően paraméterezve a kapott
szegmenshatárok jól követik az objektumok határait, ugyanakkor nincs lehetőség
geometriai kritériumok alkalmazására, a keletkező szegmensek számát, méretét nem
tudjuk kontrollálni.
Szuperfelbontású felvételeken lokális inhomogenitások, a domborzati és a fény-
árnyék viszonyok is okozhatnak nagy intenzitásváltozásokat, emiatt a módszer ezen
felvételekre nem alkalmazható.
A gradiens alapú éldetektor az egyes képpontok közvetlen környezetében méri az
intenzitásváltozást. A szomszédos képpontok intenzitásbeli különbsége a gradiens. A
digitális képet, mint f(x,y) kétváltozós függvényt tekintve az (x,y) pontbeli gradiens:
∂∂
∂∂=∇ ),(),,(),( yx
y
fyx
x
fyxf
ahol x
f
∂∂
, x
f
∂∂
a pixelérték első deriváltjai. A gradiens alapú éldetektálás a gradiens
diszkrét közelítése, a felvételen az operátor az intenzitásváltozásokat kiemeli (a változás
nagyságának függvényében), a homogén területeket elnyomja. A művelet eredményét
éltérképnek nevezzük.
A Sobel és a Prewitt szűrő ugyanazon elven működik, a felvétel minden
képpontját konvolválja egy adott magfüggvénnyel.
A Sobel-magfüggvények:
- 26 -
x
f
∂∂
:
−−−
101
202
101
és y
f
∂∂
:
−−
121
000
121
,
a Prewitt-magfüggvények:
x
f
∂∂
:
−−−
101
101
101
és y
f
∂∂
:
−−−
111
000
111
.
A két irány menti konvolúció eredményét összefuttatva kapjuk az éltérképet.
A Laplace szűrő a második deriváltak diszkrét közelítését alkalmazza:
fy
f
x
fyxfyxg
∂∂+
∂∂=∆= 2
2
2
2
),(),(
a konvolúcióban alkalmazott magfüggvény:
−−−
−
010
141
010
A második deriváltak miatt a Laplace operátor zajérzékeny, ezért önmagában csak
mesterséges képekre alkalmazható. Gauss-simítással kombinálva alkalmas természetes
képek szűrésére is, ez az ún. LoG (Laplacian of Gaussian) szűrő.
5. 1. 3. Régió-alapú szegmentálás
Alapvetően kétféle régió-alapú szegmentálási módszert alkalmazunk. A
módszerek iteratívak, minden lépésben a pillanatnyi állapotra alkalmazzák a műveletet.
Az összevonás-alapú módszerek az eljárás első lépésében minden képpontot önálló
szegmensnek tekintenek, és meghatározott módon, iterációs lépésekben a feltételeknek
megfelelő szomszédos elemeket összevonják. A vágás-alapú szegmentáló eljárások első
lépésben az egész felvételt egy szegmensnek tekintik, iterációs lépésekben a
szegmenseket kisebb elemekre felbontja. A szakirodalom számos régió-alapú
szegmentáló módszert ismer. Természetesen az alkalmazott eljárás lehet összetett,
ahogy az a később bemutatott gyakorlati példákban is látható. A képpont-alapú
- 27 -
eljárások mellett a szegmentálásnak létezik gráfelméleti megközelítése is. Az
algoritmusokban alkalmazható adatszerkezetről a Függelékben írok röviden.
5. 1. 4. A szegmentálás, mint gráfelméleti probléma
A kép reprezentálható irányítatlan gráffal, a következő módon. Az irányítatlan
gráf egy G = (V, E, ω) hármas, V a csúcsok, VVE ×∈ az élek halmaza, →∈ Eω ℝ
súlyfüggvény. A reprezentáláshoz rácsgráfot használunk, ahol a képpontok a gráf
csúcsai, az élek súlyozása a szomszédos pixelek viszonya alapján történik.
A gráfban a szegmenseket összefüggő részgráfokkal írhatjuk le. Mind az
összevonás, mind a vágás-alapú szegmentálás megoldható gráfelméleti úton. A vágás a
csúcshalmaz diszjunkt részhalmazokra bontását jelenti. Ekkor csak azok az élek
maradnak meg, melyek az egyes szegmenseken belüli pontokat kötik össze.
Az eljárások az összevonást illetve vágást iteratívan ismétlik, valamilyen
terminálási feltétel teljesüléséig. Ez lehet a szegmensek száma, további összevonási,
vágási lehetőségek hiánya, vagy fix lépésszám is.
5. 2. Összevonás-alapú szegmentálás
Az összevonás-alapú szegmentálás alulról felfelé építkező folyamat. Első
lépésben minden képpont (vagy meghatározott méretű cella) önálló szegmens. A
szomszédos elemek összevonása adott homogenitási kritérium teljesülése esetén
történik meg. A homogenitási kritérium mellett minimális méretet is előírhatunk a
kapott szegmenseknek. Ilyenkor a kritérium alapján össze nem vonható szegmens a
legkevésbé különböző szomszédhoz csatolható.
5. 2. 1. Szekvenciális csatolás
A pixel-alapú módszer 2x2-es cellákra osztja a képet, majd az egyes cellákról
eldönti, hogy homogénnek tekinthető-e. A 2x2-es felosztás helyett más, kettő-hatvány
- 28 -
méretű kezdeti cellaméret is alkalmazható. A homogenitási kritériumot a cellában az
egyes sávok átlagának és szórásának különbsége adja, a következő egyenlőtlenségben
látható módon:
H
n
i
i Cxn
xx≤
−−
∑=1
2
2
)1(
)(
ahol n a cella pixelszáma, jelen esetben 4. Az inhomogén cellákat nem soroljuk
szegmensbe, a homogén cellákkal egy területnövelő algoritmust hajtunk végre. Ez
szekvenciálisan, felülről lefelé és balról jobbra haladva a homogén cellákat valamelyik
(a legközelebbi) szomszédos szegmenshez próbálja sorolni. Ha nem lehetséges
összevonás, a cella egy új szegmens kezdete lesz.
Az összevonás lehetőségét a szegmensekhez tartozó intenzitások átlaga és szórása
által meghatározott ANOVA-kritériumok döntik el. Legyen x és y a vizsgált szegmens
elemei (x m elemű, y n elemű minta), z az összevonással kapott minta. Minden sávban
kiszámoljuk az
∑=
−=m
iix xxA
1
2)( ∑=
−=n
iiy yyA
1
2)(
∑=
−=m
iix zxB
1
2)( ∑=
−=n
iiy zyB
1
2)(
értékeket.
Ezután legyen yx AAA += és yx BBB += . A szegmensek összevonhatók, ha az alábbi
egyenlőtlenségek minden sávra teljesülnek:
12/)()/( CBA nm ≥+
2
2/1
2
11
))/((
)/()/(C
nmA
nAmAnm
ny
mx ≥
+ −+
−−
meghatározott C1 és C2 értékekre.
Az eljárás eredménye egy szegmenstérkép, melyen egy szegmens várhatóan egy
felszínborítási egységhez tartozik, de természetesen egy felszínborításhoz több
szegmens is tartozhat. Az algoritmus műveletigénye Ο(n), azaz lineáris a képpontok
számának függvényében.
- 29 -
5. 2. 2. Legjobb összevonás
Az eljárás első lépésben minden képpontot önálló szegmensnek tekint. A vizsgált
szegmenst a hasonlósági kritériumnak legjobban megfelelő szomszéddal (esetleg
szomszédokkal) összevonja. Az algoritmus iteratív, többször bejárja a képet, leállási
feltétele egy adott szegmensszám elérése, vagy további összevonások lehetőségének
hiánya lehet. Első megközelítésben az algoritmus sorrendfüggő, azaz előfordulhat, hogy
egy az A és a B szegmenssel is szomszédos C szegmens az A-val kerül összevonásra, ha
az A-t vizsgáljuk előbb, B-vel, ha a B-t vizsgáljuk előbb, ugyanakkor A-C-B szegmens
már nem keletkezik. A sorrend-függőség elkerülésére ideális megoldás, hogy minden
iterációban csak egy összevonás történik, majd újraszámoljuk minden szomszédos
szegmens-pár hasonlóságát.
Az eredményt befolyásolja a hasonlósági (különbözési) kritérium és a leállási
feltétel megválasztása. A következőkben két kritériumot mutatok be:
Tilton kritérium:
Tilton kritériuma az átlagos négyzetes eltérés megváltozásának minimalizálásán
alapul. Valamely spektrális sávra az átlagos négyzetes eltérést (MSE – Mean Square
Error) a következő várható értékkel definiáljuk:
[ ] ∑=
−−
≅−=N
p
rpp
r PPN
PPEMSE1
22 )(1
1)(
ahol P az eredeti érték, Pr a régió átlaga, N a felvétel képpont-száma. A sáv
szórásnégyzetével normalizálva:
2σMSE
NMSE=
Vizsgáljuk az átlagos négyzetes eltérés megváltozását két szegmens összevonása után:
2σMSEMSE
NMSEc −=∆
ahol MSE az összevonás előtti, MSEc a az összevonás utáni érték. Több sáv alapján
végzett szegmentálásnál minimalizálandó a sávonként kiszámolt ∆NMSE értékek átlaga,
összege, vagy maximuma. A minimumot adó két szegmens összevonása jelenti a
legjobb összevonást.
- 30 -
Beaulieu és Goldberg kritérium:
Legyen f(x,y) a felvétel, mint kétváltozós függvény, és S1, S2, … Sn a felvétel
szegmensei. Ekkor fi(x,y) az Si szegmens képpont-értékeit jelenti. Legyen továbbá r i(x,y)
az f(x,y) polinomiális közelítése. Ekkor a szegmensbeli közelítés hibája az i.
szegmensben:
∑∈
−=iSyx
ii yxryxfSH),(
2)),(),(()(
Minimalizálandó ennek a hibának a megváltozása (növekedése) két szegmens
összevonásakor, azaz a feladat megtalálni azt a szegmenspárt, melyek összevonása a
legkisebb növekedést eredményezi. A kritérium felírható a következő módon:
)()()( jijiij SHSHSSHC −−∪=
.
A legjobb összevonás műveletigénye legrosszabb esetben négyzetes (Ο(n2)),
optimalizálva, megfelelő adatszerkezeteket használva Ο(n·logn) lehet.
5. 2. 3. Gráf alapú összevonás
A korábban említett rácsgráfban az első lépésben minden képpont önálló
szegmens. A szegmenseket heterogenitásukkal jellemezzük, ami az egyes szegmenseket
reprezentáló részgráfok feszítőfájában a maximális él súlya, legyen ez az S
szegmensben het(S). A szomszédos S1 és S2 szegmens összevonható, ha ez nem
változtatja meg jelentősen a heterogenitást, azaz ha a következő egyenlőtlenség teljesül:
)()(,)(min 212
21
1 SShetS
kShet
S
kShet ∪>
++
ahol k alkalmas küszöbérték, ennek és a szegmens elemszámának hányadosa arányos
korrekciós tényező.
Első lépésben az eljárás minden élt megvizsgál a súlyok növekvő sorrendjében, és
lehetőség szerint összevon részgráfokat. A rendezettség miatt az az él, amely mentén
összevonás történik, az új szegmensben a minimális feszítőfa maximális éle lesz, így a
feszítőfát nem kell meghatározni. Az algoritmus futási idejét a rendezés határozza meg,
megfelelő adatszerkezetet alkalmazva Ο(n·logn) hatékonyságú.
- 31 -
5. 3. Vágás-alapú szegmentálás
A vágás-alapú szegmentálás felülről lefelé építkező módszer, első lépésében a
teljes felvétel egy szegmens, melyet a kritériumok alapján minden lépésben több részre
bont. A bemutatott algoritmusok mind gráf-alapúak, ugyanakkor a hisztogram-alapú
eljárás alapgondolata is felhasználható, ahogy azt az eCogniution programrendszer
kínálta egyik szegmentálásnál (contrast split segmentation) ezt látni is fogjuk.
5. 3. 1. Minimális átlagsúly alapú vágás
Az algoritmus gráf alapú, az élsúlyokat hasonlóság függvény adja, azaz a kisebb
élsúly nagyobb intenzitáskülönbséget jelent a szomszédos képpontok között. A vágás
minimális átlagsúlyú élhalmaz mentén történik, zárt vágásokat is megengedve.
A vágás egy lépésben a G gráfot két diszjunkt (G1 és G2) részgráfra vágja. A
legegyszerűbb súlyfüggvény a két részgráfot összekötő élek súlyának összege:
∑∈∈∈ EvuGvGu
vu),(,, 21
),(ω
Minimális vágás az, melyre a súlyfüggvény az összes lehetséges vágás közül a
legkisebb értéket adja. Az eljárást így az élhalmazok mérete is befolyásolja, ezt
elkerülendő az összeget a vágásban szereplő élek számával normáljuk:
∑∑
1
),( vuω
Az így definiált eljárás nem alkalmazható a gyakorlatban, ugyanis a minimális
átlagsúlyú élhalmaz megtalálása az általános gráfok körében NP-nehéz, azaz
polinomiális időben nem megoldható. Ugyanakkor a probléma áttranszformálható oly
formára, melyre létezik polinomiális idejű algoritmus.
Első lépésben minimális átlagsúlyú vágás helyett minimális átlagsúlyú egyszerű
kört keresünk. Az egyszerű kör feltétel azt jelenti, hogy a körben minden elem egyszer
szerepel. Ez a lépés egy gráf-transzformáció, az új gráf elnevezése duális gráf:
GD = (VD, ED, ωD).
- 32 -
GD duális gráf előállítása:
1. Minden G-beli rácshoz rendelünk egy pontot a duális gráfban, amely a
rács közepére kerül.
2. Létrehozunk egy segédcsúcsot.
3. Minden Ee∈ élnek megfeleltetünk egy ugyanakkora költségű
DD Ee ∈ duális élt. A duális gráf határoló csúcsaiból a segédcsúcsba futnak
az eredeti gráf határoló éleinek megfelelő duális élek.
Ebben a GD gráfban keresünk minimális átlagsúlyú egyszerű kört. A kapott
élhalmaznak megfelelő élek halmaza az eredeti gráfban lehet kör, így zárt vágást, vagy
két szélső élt is tartalmazó halmaz, így nyílt vágást kapunk.
Minimális átlagsúlyú kör keresése irányítatlan gráfban ugyanúgy NP-nehéz, de
irányított gráfon már megoldható polinomiális időben, ezért egy újabb transzformációra
van szükség. Következő lépésben minden él súlyát csökkentjük úgy, hogy a keletkező
gráfban legyen pontosan egy negatív kör. A megfelelő értéket a legkisebb és
legnagyobb élsúlyból indított logaritmikus kereséssel határozhatjuk meg, szükség esetén
megfelelő leállási feltételt adva a keresésnek.
A polinomiális időben való megoldhatósághoz még egy transzformációra van
szükség, hogy az előálló gráfra alkalmazható legyen a tökéletes illesztés feladata. A
tökéletes illesztés olyan részgráf előállítása, mely tartalmazza az összes csúcsot, és
minden csúcshoz pontosan egy élt a teljes gráfból. E részgráfok közül kell
kiválasztanunk a minimális átlagsúlyút. Ehhez a negatív kört tartalmazó duálisból elő
kell állítani a GM = (VM, EM, ωM) gráfot. Első lépésben minden GD-beli u csúcshoz
rendelünk egy u1 és u2 csúcsot, és az ezeket összekötő nulla súlyú élt. Majd minden
DEvu ∈),( élhez további két csúcsot rendelünk, ezek jelölése uv és vu. Az uv és vu
csúcsokat 0 súlyú éllel kötjük össze, továbbá éleket rendelünk az uv - u1, uv - u2, vu - v1,
és vu - v2 csúcsok közé, ezek súlya ωD(u,v)/2. A GM gráfban keresünk negatív tökéletes
illesztést, ami egyben a gráf minimális tökéletes illesztése. Ez a feladat Ο(n2·m) időben
megoldható, ahol n a csúcsok, m az élek száma.
- 33 -
Természetesen ez a művelet egy vágást hajt végre, két szegmenst létrehozva. A
keletkező szegmensekre a vágást - a teljes leírt folyamatot - iteratívan végrehajtva,
leállási feltételeket előírva kapjuk a kép egy szegmentálását.
A módszer érzékeny a képzajokra, a környezettől önmagukban eltérő képpontokat
önálló szegmensbe sorolja be. További probléma, hogy bizonyos esetekben hamis
vágást is végrehajthat, ami felesleges szegmensek létrejöttét jelenti. A zajokból
származó szegmensek okozta problémákat megoldhatja egy, a szegmentálás után
alkalmazott keresés, amely egy adott korlátnál kisebb képpont-számú szegmenseket a
hozzá legjobban hasonló szomszédjához csatolja.
5. 3. 2. Minimális arány alapú vágás
Az arány alapú vágás a minimális átlagsúly-alapú vágás egy továbbfejlesztett
változata. Az eljárásban két súlyfüggvényt használunk, ω1-t és ω2-t, ω2 bármeny élre
csak pozitív értékű lehet. A súlyok aránya ω1/ω2. Vezessük még be a határköltség
(ci(A,B)) és a körköltség (ci(C)) függvényeket a következő módon:
∑∈∈∈
=EvuBvAu
vuBAc),(,,11 ),(),( ω
∑∈
=Cvu
vuCc),(
11 ),()( ω
∑∈∈∈
=EvuBvAu
vuBAc),(,,22 ),(),( ω
∑∈
=Cvu
vuCc),(
22 ),()( ω
A határköltség az A és B részgráfok közötti összefüggés erejét adja meg, ezt a
második költséggel normalizáljuk, így a részgráfok közötti arány c1(A,B)/c2(A,B). Ez a
minimális átlagsúly-alapú vágás súlyfüggvényének általánosítása, ha minden
Evu ∈),( -re ω2(u,v)=1, akkor megegyezik vele, azaz a probléma a korábban leírt
transzformációk után oldható meg polinomiális időben.
- 34 -
Az algoritmus régiókra (például egy szegmentálás eredménye) is alkalmazható,
ekkor teljes tartományok szintjén történik a vizsgálat, ugyanakkor a régióalapú gráf nem
feltétlenül rácsgráf. Régióalapú vágással korrigálhatóak a hamis vágások.
5. 3. 3. Normált minimális vágás
A minimális átlagsúly alapú vágás súlyfüggvényét itt is alkalmazzuk:
∑∈∈∈ EvuBvAu
vu),(,,
),(ω
A normalizálás figyelembe veszi a vágás méretét, az osztás a szegmensből kivezető élek
súlyának összegével történik, azaz a vágófüggvény:
∑
∑
∑
∑
∈∈
∈∈
∈∈
∈∈ +=
GtBv
BvAu
GtAu
BvAu
tv
vu
tu
vu
BANcut
,
,
,
,
),(
),(
),(
),(
),(ω
ω
ω
ω
Ahol a nevezők szokásos jelölése assoc(A,G) illetve assoc(B,G). Az optimális vágást az
Ncut(A,B) minimalizálásával kaphatjuk meg. Ez NP-nehéz probléma, ugyanakkor a
valós számok körében jó közelítés adható rá.
Legyen D diagonális mátrix, melynek i. eleme:
∑∈
=Gj
ii jid ),(ω
azaz az i. csúcsba vezető élek súlyának összege, továbbá W a gráf súlymátrixa, azaz:
),( jiWij ω=
Továbbá legyen x indikátorvektor, azaz xi = 1, ha az i. csúcs az A részgráfban van,
különben xi = -1, és y = (1 + x) - b(1 - x), ahol:
k
kb
−=
1
és
∑
∑>=
ii
xi
d
d
k i 0
Ekkor a minimalizálás felírható, mint:
- 35 -
Dyy
yWDyxNcut T
T
yx
)(min)(min
−=
ami a Rayleigh hányados. Tovább egyszerűsítve a minimalizálás a következő sajátérték-
egyenlet:
DyyWD λ=− )(
Az eljárás rekurzív módon működik. Egy gráfról minimális vágást alkalmazva
eldönthető, hogy egy szegmest alkot-e. Amennyiben vágni kell, a normált vágással két
részgráfot hozunk létre, majd a keletkező részgráfokra alkalmazzuk az eljárást. A
rekurzió bizonyíthatóan optimálisan terminál, a vágásoknak polinomiális idejű
megvalósítása ismert. A normált vágás a sajátérték-egyenlet megoldása jelenti, például
Lanczos-módszerrel.
- 36 -
6. Gyakorlati feladatok megoldása a Definiens eCognition programrendszerrel
Az eddigiekben leírt elméleti háttér után rátérek a szegmentálás gyakorlati
alkalmazásának bemutatására. Az alkalmazások megvalósítása egy objektum alapú
képfeldolgozó programrendszerben történt. Megjegyzendő, hogy a programrendszer
kínálta szegmentáló eljárások nem az elméleti részben tárgyalt algoritmusok
tükörfordításai, hanem azokból összetett komplex módszerek. Kereskedelmi program
lévén az algoritmusok forráskódja nem áll rendelkezésre, de a hozzá tartozó leírás
(Reference Book) elég részletet árul el az eljárások elméleti hátteréről.
6. 1. Gyakorlati alkalmazások
A szegmentálás és az objektum alapú képelemzés gyakorlati alkalmazásaiból
mutatok be néhány példát. Ezeket a feladatokat a Földmérési és Távérzékelési
Intézetben (FÖMI) dolgoztam fel. Minden alkalmazás a FÖMI egy-egy fontos
feladatához kapcsolódik, ugyanakkor az általam alkalmazott objektum alapú technikát
ezen feladatkörökben az intézet korábban nem alkalmazta, bár kutatás-fejlesztés a
szegmentálás témakörében régóta zajlik a FÖMI és az ELTE IK Algoritmusok és
Alkalmazásai tanszék közös munkájában.
Végzett munkám célja nem a bevett módszerek kiváltása, de lehetőséget ad azok
más szemszögből történő értékelésére, összehasonlításra, illetve megvizsgálhatjuk az
OBIA módszerek későbbi operatív alkalmazásának lehetőségét is.
Az elemzéseket a Definiens eCognition 8.0 objektum alapú képfeldolgozó
programrendszerben végeztem. A feladatok bemenő adata ortofotó, illetve
szuperfelbontású űrfelvétel, elsődleges eredménye egy vektoros formátumú tematikus
térkép, azaz ún. shapefile, mely alkalmas további feldolgozásra térinformatikai
rendszerekben. Az elemzendő adatokat előfeldolgozott formában kaptam meg. A
feldolgozási folyamat első lépése egy, a kitűzött célnak lehető legjobban megfelelő
- 37 -
szegmentálás kidolgozása. A programrendszer számos, a bemutatott algoritmusokból
felépített eljárást kínál, a feladathoz alkalmas lépések kiválasztása és paraméterezése a
szegmentálás elméletének ismerete mellett fotogrammetriai ismereteket is igényel, a
paraméterezés finomhangolása kísérletezés, tesztelés útján történt. Mindemellett a
szegmentálás eredményének értékelésekor az alkalmazott felvétel korlátait is
figyelembe kell vennünk. A szegmentálás után a kapott objektumok osztályozása
következik. Az osztályozás a feladat nehézségének függvényében több lépésből állhat,
az objektum alapú elemzés lehetőségeire erősen támaszkodva. Az osztályozás alapja
kijelölt tanulóterületeken történő mintavételezés. A tanulóterületek kijelölése egyes
feladatokban a felvétel vizuális áttekintése alapján, a parlagfű-detektálás alkalmazásban
terepi felmérés adatai alapján történt. A szegmentáláshoz hasonlóan az osztályozás
pontosítása is kísérletezés és tesztelés útján, az egyes tematikus kategóriákat leíró
valószínűségi görbék módosításával történt.
Először röviden bemutatom a használt programrendszert, majd az egyes
alkalmazások fejlesztési folyamatát és eredményeit. Természetesen jóval szélesebb körű
mind a objektum alapú elemzés, mind a konkrét programrendszer alkalmazási
lehetősége. Célszerű lenne a mikrohullámú távérzékelt felvételek (RADAR) objektum
alapú elemzési lehetőségének vizsgálata, az eCognition erre alkalmas, ugyanakkor a
mikrohullámú technika elméleti háttere nem része dolgozatomnak, ezért e téren
gyakorlati alkalmazást nem ismertetek.
6. 2. A Definiens eCognition programrendszerről
A Definiens eCognition egy objektum alapú képelemző programrendszer,
elsősorban távérzékelt illetve orvosi felvételek feldolgozására kifejlesztve. Kifejlesztője
a müncheni illetőségű Definiens AG. A FÖMI-ben a 8.0-ás verzió érhető el. A rendszer
három modulból áll, melyekből a feladatokban az elemző környezetet biztosító
eCognition Developer és a kötegelt feldolgozást vezérlő eCognition Server kap
szerepet.
A felvételek egyes sávjai a programban képrétegekként jelennek meg. A képi
információ legalsó szintje a képréteg. A kép megjelenítésére tetszőleges sáv-színpuska
- 38 -
kombináció választható, a feldolgozást értelemszerűen nem befolyásolja a megjelenített
kompozit. A képi rétegekből tematikus rétegek, illetve rétegműveletekkel további
rétegek, például spektrális indexek hozhatóak létre.
A képi objektumok hierarchikus rendszert alkotnak. A legalsó szint a pixelek
szintje. Az objektumok felépítése e szint alapján történik, ugyanakkor a szinten
végrehajtható műveletek száma erősen korlátozott. Osztályozást, egyes szegmentáló
lépéseket nem lehet pixel-szinten végrehajtani. Az objektumok szintje összetett, további
hierarchikus szintekre bontható.
A képelemző folyamat fejlesztése ún. szabályrendszerek (Rule Set)
megalkotásából áll. A szabályrendszer különböző folyamatokból áll, ezek a
szegmentáló, osztályozó műveletek, morfológiai műveletek, rétegműveletek, exportálás.
A folyamatok két szinten, a pixelek és az objektumok szintjén hajthatnak végre
műveleteket. A művelet kiválasztásával van lehetőség a paraméterek beállítására,
megadhatóak a bemenő rétegek, az eredmény helye (réteg, osztály). Lehetőség van
változók definiálására is.
Megemlítendő a felvétel cserepekre (tiles) osztásának lehetősége. A
feldolgozandó felvételek mérete miatt egyes műveletek erőforrás-igénye gyakran
meghaladja a rendelkezésre álló kapacitást. A szegmentálás nagy memória-igényéről
már volt szó, nagy méretű felvétel szegmentálása csak darabonként történhet. A
cserepek mérete megválasztható. A szegmentálást a cserepeken végrehajtva majd a
cserepeket egyesítve kapjuk a teljes felvétel szegmentálását, az éles határok
megjelenése egy összevonó lépéssel kiküszöbölhető.
A kifejlesztett szabályrendszer végrehajtható a felvétel egy részén vagy egészén,
illetve több felvételen is.
6. 3. Az eCognition szegmentáló eljárásai
A programrendszer többféle feltételű és célú szegmentáló eljárást kínál. Az
eljárások több szinten végrehajthatóak (az esetleges korlátozásokat az egyes
- 39 -
algoritmusoknál megemlítem), a képpontok szintjén az objektumok létrehozása,
objektum-szinten a meglévő szegmentálás finomítása, szegmensek összevonása, vagy
szétvágása lehet cél. Egyes eljárások csupán a feldolgozandó adatmennyiség
csökkentésére szolgálnak, az általuk létrehozott objektumok nem tényleges szegmensek,
ugyanakkor nagyméretű felvételek esetén szükséges a képpontok helyett ezek
alkalmazása a szegmentálás bemenő adataként.
Az algoritmusok változatos paraméterezési lehetőséggel bírnak. Az eljárások
részletezésekor csak a szegmentálás szempontjából érdekes paramétereket említem.
Ezek mellett a kimenő adatokat is befolyásolhatjuk, például a küszöböléssel kapott
szegmenseket osztályokba rendelhetjük. A szegmentálást befolyásoló paraméterek
eljárás-függőek. Kiválaszthatóak a felvétel azon sávjai (képi és számolt sávok
egyaránt), melyek alapján az algoritmus dolgozik, ezek súlyozására is lehetőség van. A
küszöb alapú eljárásokban a küszöbérték meghatározását, a kritérium alapú
eljárásokban a homogenitás mértékét és összetevőit állíthatjuk be a paraméterekkel.
A részletezés során az alkalmazható eljárások és lehetséges paramétereik angol
nyelvű elnevezését használom, ezek magyar fordítása egyértelmű. Az egyes
szegmentálások eredményeit a későbbiekben bemutatásra kerülő „facsoportok
lehatárolása” feladatban is használt színes infravörös légifelvételen szemléltetem, ahol
indokolt, ott többféle paraméterezés mellett.
Chessboard segmentation:
A sakktábla-szegmentálás a képet négyzetekre bontja. Értelmes jelentéssel bíró
objektumok létrehozására nem használható, ugyanakkor további szegmentáló lépések
előkészítésére használhatjuk, elsősorban nagyméretű felvételek feldolgozását
gyorsíthatjuk meg. A képpontok helyett a létrehozott szegmenseket használjuk az
értelmes objektumokat létrehozó algoritmusok bemenő adataként.
Paraméterei: a négyzet kívánt oldalhossza.
- 40 -
7. ábra: sakktábla szegmentálás eredménye 100 pixel oldalhosszal (a színes infravörös felvételek valamint a hamisszínes kompozit
jellemzője a növények vörös színe)
Quadtree segmentation:
A sakktábla-szegmentálás összetettebb változata, a képet négyfa-ráccsal (l.
Függelék) felosztja. A felosztást a méretre adott felső korlát, valamint paraméterezhető
homogenitási kritérium befolyásolja. A homogenitási kritérium alkalmazásával a kapott
objektumok az erős geometriai megkötöttség mellett spektrálisan is összefüggenek. Ezt
az algoritmust is elsősorban nagy felvételeken, a további lépéseket segítendő
alkalmazzuk.
A paraméterek:
Scale: a szegmensen belüli spektrális eltérés maximuma a kiválasztott rétegeken.
Layer weights: a szegmentálás során alkalmazni kívánt rétegek kiválasztása, súlyozása.
- 41 -
8. ábra: négyfa szegmentálás scale=50 és scale=100 paraméterezéssel
Contrast split segmentation:
Az eljárás az objektumokat sötét és világos szegmensekre bontja. Az algoritmus
(a hisztogram alapú szegmentálásnál bemutatott módszerhez hasonlóan) minden
objektumra meghatároz egy optimális küszöböt, mely a keletkező világos és sötét
szegmensek közötti kontraszt maximuma. A küszöböt paraméterként megadható
intervallumban keressük Az algoritmus meglévő objektumokat vág fel, pixelszinten
alkalmazva ezért először végrehajt egy sakktábla-szegmentálást, melynek eredménye
adja a vágandó objektumokat.
Paraméterezés:
Chessboard tile size: pixelszinten a kezdeti objektumok mérete
Minimum/maximum threshold: az intervallum, melyben a küszöb meghatározandó.
Step size: a küszöb meghatározásán alkalmazott lépésköz (nagyobb érték-gyorsabb,
kisebb érték-nagyobb kontraszt az objektumok között)
Image layer: az alkalmazott réteg
Contrast mode: a használandó mérték: él-alapú, objektum-alapú
Megadható egy-egy osztály a sötét és világos objektumok számára, változók a küszöb
és a kontraszt számára, minimális objektumméretek.
- 42 -
9. ábra: contrast split szegmentálás a következő paraméterezéssel: chessboard tile size=256, step size=3, contrast mode=object difference
Multiresolution segmentation:
Az algoritmus képpontokat vagy objektumokat von össze, azaz összevonás-alapú.
Optimalizáló módszer, adott objektumszám mellett minimalizálja az átlagos
heterogenitást, és maximalizálja az objektum saját homogenitását. Olyan objektumokat
von össze, melyek kölcsönösen legjobban illeszkednek egymáshoz.
Az algoritmus lépései:
1. kezdő lépésben minden képpont önálló objektum. Ezeket több lépésben nagyobb
objektumokba vonja össze, amíg azok egy adott homogenitási küszöböt el nem
érnek. Ez a küszöb a paraméterben megadható spektrális és alaki homogenitás
értékekből keletkezik.
2. Az így keletkezett minden magobjektumhoz megkeresi a legjobban illeszkedő
szomszédot
3. Ha a legjobban illeszkedés nem kölcsönös, az összehasonlításban szereplő
objektum lesz a következő vizsgált objektum
4. Ha a legjobban illeszkedés kölcsönös, a két objektumot összevonja
- 43 -
5. minden iterációs lépésben minden objektumot egyszer vizsgál
6. Az iteráció leáll, ha nincs további összevonási lehetőség.
Paraméterezés:
Layer weights: a szegmentálás során alkalmazni kívánt rétegek kiválasztása, súlyozása.
Scale parameter: a megengedett maximális heterogenitás egy objektumon belül
Shape: a spektrális és geometriai homogenitás mértéke (color = 1 - shape)
Compactness: az objektumok kompaktságának mértéke
10. ábra: a multiresolution segmentation kritériumának összetétele
- 44 -
11. ábra: multiresolution segmentation color=0,9, scale=50 paraméterek mellett
12. ábra: multiresolution segmentation scale=50 paraméter és nir=2, red=1, green=0 sávsúlyok mellett
- 45 -
13. ábra: multiresolution segmentation scale=10 paraméterek mellett
14. ábra: multiresolution segmentation color=0,1 (shape=0,9), scale=50 paraméterek mellett
Spectral difference segmentation:
Az algoritmus szomszédos objektumokat von össze, amennyiben az átlagos
intenzitásértékeik különbsége a megadott küszöb alatt marad. Szegmentálás
finomítására tervezett algoritmus, képpont szintből objektumok létrehozására nem
használható.
- 46 -
Paraméterezés:
Maximum spectral difference: két összevonandó objektum maximális eltérése.
15. ábra: spectral difference szegmentálás maximum spectral difference=5 paraméter mellett
Multi-threshold segmentation:
Az eljárás az objektumokat felosztja megadott pixel-szintű küszöbértékek alapján.
Megadható tetszőleges számú küszöb, az objektumokat osztályokba is sorolhatjuk.
6. 4. Osztályozás végrehajtása
A szegmentálással létrehozott objektumokon végrehajtható az osztályozás. Ahogy
említettem, az objektum alapú osztályozás menete hasonló a pixel-alapú
osztályozáshoz, ugyanakkor az osztály definiálására jóval szélesebb körű lehetőség
adott. A spektrális átlag és szórás mellett a programrendszer geometriai és texturális
jellegzetességek, valamint az osztályhierarchiában betöltött szerep is megjelenhet az
osztály leírásában. A leírásban megadhatóak küszöbértékek, vagy valószínűségi görbék
az egyes jellegzetességekre. A fix küszöbérték az objektumok osztályhoz való
illesztésében 0 vagy 1 valószínűséggel szerepel. Az osztályhoz tartozást a jellemzők
- 47 -
valószínűségének minimuma dönti el. Abba az osztályba soroljuk az objektumot,
melyre ez a minimum maximális, amennyiben ez legalább 0,1 valószínűséget jelent. Ezt
az osztályozást „classification” eljárással hajthatjuk végre. Az osztályozandó
objektumok köre szűkíthető például korábbi osztályozás kategóriái alapján. A
célosztályok szintén megválaszthatók, az illesztés csak a kiválasztott osztályokra
történik meg.
A „classification” eljárás mellett az „assign class” eljárással lehetőség van
objektumok egy adott osztályba sorolására küszöbértékek megadásával is, ekkor nincs
szükség osztálydefinícióra. Ekkor is megadható az osztályozandó objektumok köre,
valamint egy célosztály. A küszöbértéknek megfelelő objektum a kiválasztott osztályba
kerül, az esetben is, ha az osztályhoz tartozik definíció, amelynek nem felelne meg az
objektum.
Az osztályozás folyamatában bármikor alkalmazható a nem osztályozott
(„unclassified”) kategória is, osztályozott objektumokat visszasorolhatunk nem
osztályozottba. Ennek például akkor van értelme, ha például egyes szomszédos
objektumok egyenként eleget tesznek az osztálydefiníciónak, de összevonva már
kiesnek a kategóriából.
Az osztályozás a jó eredmény érdekében a szegmentáláshoz hasonlóan tesztelést
igényel. Javítás a küszöb vagy a valószínűségi görbe módosításával hajtható végre, ez
utóbbi a tartomány tetszőleges helyén módosítható, ahol az értéke nem 0.
- 48 -
7. Fák lehatárolása (MePAR felújítás)
Az eszköz rövid leírása után rátérek az egyes gyakorlati alkalmazások bemutatására. A
FÖMI egyik legfontosabb, legnagyobb emberi erőforrásokat igénylő feladata a
Mezőgazdasági Parcella Azonosító Rendszer (MePAR) üzemeltetése és folyamatos
felújítása. A MePAR a területalapú támogatások kizárólagos hivatkozási rendszere
(2004-től), melyben minden mezőgazdasági tábla egyértelműen azonosítható és
lekérdezhető. A MePAR EU-szintű feladatai a terület alapú mezőgazdasági
támogatások kezelése a kérelmezéstől a terepi és távérzékeléses ellenőrzésig. A
rendszer alapegysége a fizikai blokk. A blokkok határvonalait jellemzően valamilyen
időben állandó természetes vagy mesterséges terepi objektum, például patak, fasor,
erdőszél, vagy utak, vasút adja. Teljes állandóság azonban ezen objektumoktól sem
várható el, a MePAR-t folyamatosan fel kell újítani. A felújítás egyik alapvető
forrásanyagát a minden évben elvégzett, az ország területének nagyjából egynegyedét
(4-5 megye) érintő légifelvételezés, illetve a légifelvételekből előállított ortofotó adja.
A rendszerben szereplő blokkok egyik fontos tulajdonsága a támogathatóságra
vonatkozik, azaz hogy igényelhető-e rá mezőgazdasági támogatás. Jellemző
támogatható területek például a szántók és a legelők, jellemző nem támogatható
területek az erdős, fás, bokros területek. A bemutatott alkalmazásom célja e területek
elkülönítése. A cél elsősorban a legelőként támogatható területeken megjelenő fás,
bokros területek automatikus lehatárolása, és a támogatható területekből való kivágása.
A feladat jellege nagyon nagy pontosságot kíván meg, az ortofotók geometriai
felbontása (0,4 m2) ezt lehetővé tenné, ugyanakkor pont e nagyon nagy felbontás a
felszínborítás olyan jellegzetességeit is rögzíti, melyek tévesztéseket eredményeznek. E
miatt a művelet teljes automatizációja nem megengedhető.
A feladattal kapcsolatban a pontosság mellett további geometriai elvárások
adottak. A MePAR felbontása nem olyan részletes, mint a felvételekből származó
vektoros eredményeké (MePAR méretű rendszert az ilyen felbontás kezelhetetlenné
tenné). Ezért az eredményeket generalizálni kell. Továbbá a 0,1 ha-nál kisebb
- 49 -
területeket nem kívánjuk rögzíteni. A lehatárolt területeket egy ún. negatív bufferrel (1
pixel mérettel) szűkíteni kell, mivel nem a felszín, hanem a lombkorona kerül
lehatárolásra. A programrendszerrel megoldható az ezen elvárásoknak való megfelelés,
geometriai jellegű műveletek végrehajtásával az osztályozás után.
A feladat pixel-alapon nem megoldható, ugyanis a használt felvétel geometriai
felbontása miatt a felszínborítási egységek nagyobbak a képpontnál. Ez a felbontás
egyfelől nagy geometriai pontosságot tesz lehetővé, ugyanakkor lokális spektrális
jellegzetességek megnehezítik az osztályozást, ugyanis nagyon nehéz elválasztani
egymástól a valóban facsoporthoz tartozó objektumokat és az esetleg hozzájuk nagyon
hasonló, de egyéb felszíni objektumhoz tartozó szegmenseket. Ilyen esetben
előfordulhat, hogy vizuális kiértékeléssel sem dönthető el egyértelműen a kérdés.
7. 1. A felhasznált felvételek
A MePAR felújításhoz minden évben megadott területről digitális légifelvételek
készülnek. A felvételezés három sávban történik, készül a látható tartománynak
megfelelő, illetve CIR felvétel, mindkét esetben sávonként 8 bites mélységben
kvantálva. A légifelvételből állítható elő a képelemző rendszerekkel feldolgozható
ortofotó. Az ortofotó térképileg helyes, területmérésre is lehetőséget adó felvétel.
Az alkalmazásban a CIR ortofotókat használom. A felvételek térbeli felbontása
0,4 (2009 évi felvételek esetén) és 0,5m. A szabályrendszer fejlesztése a 2009-es
felvételeken történt, mely Bács-Kiskun, Fejér, Tolna és Baranya megyéket fedi.
A mezőgazdasági célú felhasználás miatt a felvételezés a nyár folyamán, a
felhőtlenség érdekében általában a délelőtti órában történik.
7. 2. A feldolgozás folyamata
A feldolgozás három fő lépésből áll. Első lépés a felvételek szegmentálása, majd a
szegmentálással kapott objektumok osztályozása következik, végül az említett
geometriai feltételeket utófeldolgozási lépésekben biztosítjuk.
- 50 -
Elsősorban az osztályozásnál figyelembe kell venni a felvételek készítéséből
faladó térbeli és időbeli tényezőket, melyek lokális sajátosságokat eredményeznek. A
felvételek nem egy időpontban készülnek, emiatt elsősorban megvilágításbeli
különbségek, a napsugárzás beesési szögének változása és így az árnyékolás
módosulása tapasztalható a felvételeken. Térbeli változásokat egyrészt a nagy terület
miatt, másrészt a domborzati viszonyok következtében tapasztalunk. Egyes, a
kategorizáláskor fontos jellemzőket ugyanis befolyásolja, hogy az adott felvétel például
a Kiskunságon, a Mezőföldön, vagy a Mecsek környékén készült. A domborzat szintén
befolyásolja a megvilágítást. Ezen tényezők miatt több szabályrendszer készült,
általában 1:100000-es EOV szelvényenként módosítva. A módosítások csak az
osztálydefiníciókat érintik, a szegmentálást nem.
Az utófeldolgozás egy része a geometriai követelményeknek való megfelelés
biztosítása, ez a szabályrendszerben megvalósított. Az eredmények MePAR-beli
feldolgozásához további, térinformatikai adatbázisban végzendő műveletekre van
szükség, melyek a dolgozat témájához nem kapcsolódnak, így ezeket nem részletezem.
A részletes leírás során kettő területet mutatok be, a Kiskunságon (Izsák-
Orgovány községek környezetében) és a Völgységben (Tolna- és Baranya megye
határa) alkalmazott osztályozást. Az ábrákon a felvételek hamis színes kompozitjai
láthatóak (R: közeli infravörös, G: vörös, B: zöld).
A fás, bokros területek elkülönítése más növénytakarástól elsősorban texturális
jellegzetességek útján történhet, ezért a feldolgozás texturális mértékekre erősen épít. A
textúra mérésére részben a már említett GLCM mátrix módszerrel, részben az
objektumok képpont-értékeinek szórását vizsgálva történik.
7. 3. Szegmentálás
A szegmentálás elsődleges szempontja a lehatárolandó objektumok
határvonalának pontos követése. Lehatárolt területek belüli megkülönböztetés nem
része a feladatnak, ezért például a különböző fafajták határvonalának szegmensekkel
való követésére nem törekedtem. További fontos szempont, hogy a várhatóan nem
lehatárolandó homogén területek a lehető legnagyobb szegmenseket alkossák. Így az
- 51 -
osztálydefiníciókban méretbeli korlátokat is bevezethetünk, továbbá a feldolgozandó
objektumok száma jelentősen csökken.
A szegmentáláshoz a képi sávok mellett további rétegeket vezetünk be. Ezek a
három sáv átlagából kapott fényesség (brightness), az NDVI, valamint a nir sáv alapján
számolt éltérkép (Canny-féle éldetektálással). Az éltérkép az objektumhatárok
megtalálása mellett jelen esetben a fák lombkoronájában megfigyelhető lokális
intenzitásváltozások kiemelésére is alkalmas, elsősorban ez utóbbi tulajdonsága miatt
alkalmazom.
A szegmentálás több lépésben történik, a kívánt eredményt fokozatosan közelítve.
A felvételek nagy mérete miatt 2000x2000 pixel méretű cserepeken történik, de emellett
is nagyon sok objektumra számítunk, ezt redukálom a szegmentálás első lépésében.
1. lépés: „quadtree segmentation” a vörös, a közeli infravörös és a fényesség
sávok alapján, scale = 30 paraméter mellett. A lépés célja az objektum-szint létrehozása.
Az algoritmusnak megfelelően a kapott objektumok négyzet-alakúak, a lokális
homogenitásnak megfelelő méretben. Inhomogén területen előfordulhat 1 pixel méretű
objektum is, határvonalakon jellemzően 4, lombkoronában 4-16 képpont méretű
objektumokat kapunk, de homogén területeken ennél jóval nagyobb lehet egy objektum.
Ezek az objektumok felhasználható információt még nem hordoznak, további
lépésekre van tehát szükség.
2. lépés: „multiresolution segmentation” a vörös, a nir, az ndvi, a fényesség és az
éltérkép alapján, az éltérkép sávot kétszeresen súlyozva. A paraméterezése: Scale = 10,
Shape = 0,1, azaz a spektrális homogenitást részesítjük előnyben, Compactness = 0,9,
azaz kompakt objektumokat várunk.
A kapott eredmény az objektumhatárokat jól követi, ugyanakkor nagyon hasonló
szomszédos objektumok maradnak, ezek összevonása szükséges, elsősorban homogén
területeken.
- 52 -
16. ábra: szegmensek a második lépés után
Itt meg kell említeni, hogy a célkategóriákba nem tartozó homogén területeken is
előfordulhatnak lokális jellegzetességek, amelyek a szegmentálás jelenlegi lépésében
önálló objektumot alkotnak. Ezen objektumok tulajdonságaik alapján bekerülhetnek
valamely kategóriába, ugyanakkor megfelelő mértékek alapján a szomszédos, homogén
területekhez állnak közelebb, amivel összevonhatóak. Ennek megoldása legalább
annyira fontos lépés, mint a határkövető szegmentálás, ennek érdekében újabb
összevonást hajtunk végre.
3. lépés: „spectral difference segmentation”: a zöld, a vörös, a nir, a fényesség és
az ndvi sávok alapján. Paraméterezése: Maximum spectral difference = 5. A lépés a
homogénebb területeket nagy objektumokká összevonja, az inhomogén célterületeken
kisebb összevonásokat hajt végre.
- 53 -
17. ábra: szegmensek a harmadik (utolsó) lépés után
A kapott eredmény megfelel az előzetes elvárásnak. Bár a szegmentálás itt
lezárulhatna, még egy lépést alkalmazunk, a szomszédos cserepek határán létrejövő
azonos tulajdonságú objektumok összevonására. Ehhez szükséges egy logikai változó
definiálása az objektumokhoz, mellyel a határokat érintő objektumokat jelöljük. A
cserepek összeillesztése után az osztályozó lépések előtt még egy „multiresolution
segmentation” szegmentálást hajtunk végre a határobjektumokon. A paramétereket úgy
állítjuk be, hogy csak a szomszédos cseréphatárokon található szegmenseket vonja
össze (megismételve a korábbi lépés paramétereit - így az azonos cserépen lévő
objektumok nem vonhatók össze).
A szegmentáló lépések minden célterületre fejlesztett szabályrendszerben
megegyeznek.
- 54 -
18. ábra: szegmentálás eredménye más jellegű területen
7. 4. Osztályozás
A szegmentálás azonos lépésekkel és paraméterezéssel alkalmazható a teljes
célterületre, az osztályozó folyamat azonban erősen területfüggő. Egyes területeken jó
eredményeket adó szabályrendszer más jellegű területeken nem elfogadható hibás
osztályozáshoz vezet. A hibák forrása többek között az eltérő domborzati viszonyok, és
az adott területre jellemző természetes és ültetett növényzet, az előforduló fa és
bokorfajták. Mindemellett a cél minél általánosabb, a lehető legtöbb területre
alkalmazható osztályozás fejlesztése.
Az osztályozási hibákat a rendelkezésre álló felvételek alapján nem lehet teljesen
kiküszöbölni, az eredmények további felhasználásának szempontjából az első- és
másodfajú hibák nem azonos súlyúak. Ha a nullhipotézis szerint az objektum nem
tartozik a célkategóriába, akkor a tévesen osztályba sorolás jelenti az elsőfajú hibát.
Mivel a beosztályozott terület a MePAR-ban nemtámogathatónak minősül, az ilyen
tévedést nem engedhetjük meg. A másodfajú hibát a valójában osztályozandó, de
- 55 -
mégsem beosztályozott objektumok adják. Az ilyen hibák teljesen nem
kiküszöbölhetőek, ha az elsőfajú hiba teljes kizárására törekszünk. Ugyanakkor
másodfajú hiba leggyakrabban a cél szempontjából érdektelen területeken, összefüggő
erdőkben fordul elő. További hibaforrást jelenthet a lombkoronák által vetett árnyék. Az
árnyékolt területet nem osztályozhatjuk be, ami például facsoportok vagy erdő szélén jó
döntés, de összefüggő erdőterületen magasabb fák árnyékának kihagyása hibás
eredményt ad. Itt ismét megemlítem, hogy összefüggő erdőterületekben előforduló
hibák a feladat szempontjából nem jelentősek, illetve geometriai feltételek teljesülése
esetén az ilyen hiba megszűntethető.
Az osztályozás bemutatására a korábban említettek szerint két jellemző területet
választottam ki. A völgységi (és az ahhoz hasonló jellegzetességeket mutató) területek
pontos osztályozása a nem osztályozandó növényzet tulajdonságai miatt nehezebb
feladat.
19. ábra: jellegzetes kiskunsági és völgységi területrészlet
Az osztályozás első lépése az árnyékok leválasztása. A szegmenshatárok az
árnyékokat is jól követik, így, és az árnyékra jellemző tulajdonságok következtében
azok besorolása nem jelent problémát. Az osztály definíciója éles (azaz valószínűségi
görbe nélküli) küszöbértékeket tartalmaz, a fényesség és a nir sávra felső, a nir sáv
GLCM homogenitására alsó korlátot adunk. Az árnyékok leválasztása után a későbbi
osztályozás könnyítésére a bármilyen növényzethez tartozó objektumok beosztályozása
történik meg, a további lépések csak ezen objektumokat vizsgálják. A növényzet
elkülönítésére értelemszerűen az ndvi indexet használjuk. Az ndvi értéke jellemzően a
- 56 -
[-1, 1] intervallumba esik, a magasabb érték magasabb klorofill-elnyelésre, így a zöld
növényzet hangsúlyos jelenlétére utal. Korlátnak 0-t választva elfogadható eredményt
kapunk, melyet geometriai tulajdonságok alapján tovább javíthatunk. A homogén
területek (szántóföld, legelő, gyep) nagyméretű szegmenseket alkotnak, így alkalmas
méretkorlát mellett ezeket a további vizsgálatból kizárhatjuk. Továbbá egy jellemző
hibaforrás, a szántókban látható szekérutak, traktornyomok hatása is részben
kiküszöbölhető. Ezek ugyanis a fákhoz spektrálisan hasonló tulajdonságokat
mutathatnak, így tévesen beosztályozhatóak, ugyanakkor geometriai jellegzetességük
(általában keskeny, hosszú szegmensek) alapján kiszűrhetőek. Ezek alapján a növényzet
osztály definíciója az ndvi indexre valamint szegmensméretre és alakra vonatkozó
korlátokból áll.
20. ábra: növénytakaró kiválasztása NDVI alapján
A következő lépés az osztályozás lényegi része. A fás, bokros területek
spektrálisan és texturálisan is, bizonyos jellegzetességek mellett nagyon változatos
képet mutatnak. A célkategórián belüli fajta-megkülönböztetés nem része a feladatnak,
így a végeredmény alkategóriákat nem tartalmaz, a folyamatban mégis szükségszerű
alosztályok bevezetése. Ezen alosztályokat fajtaismeret nélkül, csupán a mutatott
jellegzetességek alapján vezetem be. A felvételek részletes vizuális áttekintése és
kísérletezés alapján kilenc kategóriát határoztam meg. A kategóriák definiálásának első
lépése a mintavételezés. Mintának minden kategóriából azt jól jellemző, lehetőleg minél
nagyobb számú objektumot választottam. A minták az objektumok kiválasztott
- 57 -
tulajdonságai alapján valószínűségi görbéket definiálnak, melyek az osztály leírásába
kerülnek. Azaz ezek alapján maximum-likelihood döntéssel minden objektumról
eldönthető, melyik osztályba tartozik a legnagyobb valószínűséggel. Értelemszerűen
előfordulhat, hogy az objektum egyik osztályba sem tartozik, ezért csak a P > 0,1
valószínűségeket vesszük figyelembe. A valószínűségi görbéket csak spektrális
tulajdonságok, az egyes sávok átlaga és szórása adják. Geometriai tulajdonságok ilyen
leírására nincs szükség, a texturális tulajdonságok nagy számításigénye pedig
kezelhetetlenül lassúvá teszi a feldolgozást. E tulajdonságok így fix küszöbként
kerülnek be az osztályleírásokba. A leírásban logikai operátorokat is használhatunk,
egyes tulajdonságok egymást kizáró, vagy együttes meglétének biztosítása érdekében.
Az alkalmazott texturális mérték minden esetben a GLCM homogenitás.
21. ábra: egy osztályhoz tartozó valószínűségi görbék (eCognition felület)
Értelemszerűen mind a valószínűségi görbék, mind a fix küszöbértékek
kísérletezéssel és teszteléssel folyamatosan javítandóak. A tesztelés kis területeket
kiválasztva, és az osztályozást azon elvégezve történik. A görbéknek mind a határa,
mind az alakja módosítható. Az egyes területekre fejlesztett szabályrendszerek között
legnagyobb különbség e ponton van, a görbék jellemzőiben és a küszöbértékekben.
Egyes területeken hasznosnak bizonyul további kategóriák hasonló módon történő
bevezetése, melyekbe biztosan nem lehatárolandó objektumok kerülnek. Előfordul
ugyanis, hogy ilyen objektumok, bár láthatóan nem tartoznak a célkategóriába,
- 58 -
tulajdonságaik alapján mégis besorolást nyernek valamelyik osztályba. Ezek
kiküszöbölésére szűk tartományú görbékkel definiált osztály alkalmas lehet.
22. ábra: az osztályozás eredménye a mintaterületeken (zöld: nem fás jellegű növény, kék árnyalatok: fatípusok)
A folyamat következő lépése a kapott eredmény javítása szűkítéssel. A cél olyan,
azonos kategóriába eső szomszédos objektumok kiválasztása, melyek egyenként
megfelelnek az osztálydefiníciónak, összevonva azonban nem teljesítenek valamilyen
feltételt. Elsősorban nagy területű, összefüggő, inhomogén textúrájú természetes
növényzet (például felhagyott mezőgazdasági, gyomos területek) okozhat ilyen hibákat.
Ennek kiszűrésére az azonos kategóriába tartozó szomszédos objektumokat
összevonjuk, majd megvizsgáljuk az összevont objektum adott feltételnek való
- 59 -
megfelelését. A kritériumok egyrészt geometriai jellegűek, valamilyen méret
meghaladása esetén az objektum az osztályból kizárandó, illetve texturális,
homogenitási korlát elérése lehet. Ezen kritériumok megadása az osztályozás nagyobb
területen történő végrehajtásával, annak hibás eredményeinek vizsgálatával lehetséges.
A továbbiakban már csak geometriai lépésekre van szükség. A végeredményben
csak egy kategória van, a jelenlegi osztályokat összevonhatjuk egy osztályba. A
szomszédos objektumok összevonása után a nem besorolt objektumok egy részét, azon
elemeket, melyek csak beosztályozott objektummal határosak, és egy méretkorlát alatt
maradnak, beosztályozunk. A lépéssel az erdős területekben előforduló homogén
foltokat, illetve árnyékként bekategorizált objektumokat, továbbá mezőgazdasági
tevékenységre alkalmatlan (például nehezen megközelíthető, kis méretű) tisztásokat
kezeljük. Az ilyen területek besorolása az eredmény felhasználóinak elvárása, része a
feladatnak (a méretkorlát is adott).
23. ábra: teljesen körbezárt, be nem osztályozott szegmensek kiválasztása geometriai jellemzők alapján (sárga objektumok)
A további, a felhasználói elvárásokat biztosító geometriai lépések az
utófeldolgozási folyamat részei.
7. 5. Utófeldolgozás
A geometriai elvárásoknak való megfelelés is megoldható a szabályrendszerben.
A generalizálás, valamint a szűkítés egy lépésben megvalósítható. A képfeldolgozásban
- 60 -
ismert morfológiai műveletek, a „shrinking” és „growing” alkalmazható a besorolt
objektumokra. A szűkítést 1 képpont méretű „shrinking” megoldaná, azonban 3 képpont
méretű „shrinking” majd 2 képpont méretű „growing” hasonló, de generalizáltabb
eredményt ad, ugyanis a növelés nem a korábbi állapot, hanem az aktuális
objektumhatár alapján dolgozik, így az eredeti cizellált határvonal leegyszerűsödik.
24. ábra: a generalizálás (régiócsökkentés és növelés) hatása
Utolsó lépésben a 0,1 ha-nál kisebb objektumok kiszűrése történik meg. Ezután az
osztályba tartozó objektumokat exportáljuk, a kapott eredmény vektoros formában, ún.
shapefile-ban áll rendelkezésre, mely térinformatikai rendszerekkel kezelhető.
25. ábra: az osztályozás végeredménye a mintaterületeken
7. 6. Pontosság
A pontosság kérdését már többször említettem. Az eredmények támogatható
területek méretét, és így a kifizetett támogatások összegét befolyásolja, ezért a módszer
- 61 -
automatikus felhasználásához nagyon pontos osztályozásra lenne szükség. Ugyanakkor
az elérhető pontosságot több tényező is befolyásolja. A felvételezés technikájából
fakadóan a légköri, megvilágításbeli tényezők nem egységesek, de űrfelvételekhez
hasonló kalibrációra (ToA reflektancia) nincs lehetőség. E mellett a nagyon nagy térbeli
felbontás olyan lokális jellegzetességeket is kiemel, amelyek következtében az adott
objektum tulajdonságai eltérnek a saját kategóriájától, esetleg egy más kategóriára
jellemző értékeket vehetnek fel, így téves osztályozáshoz vezetnek. Előfordulnak olyan
objektumok, melyekről vizuális kiértékeléssel sem dönthető el egyértelműen, hogy
milyen felszínborítási kategóriához tartoznak.
Mindezek mellett az elért pontosság általánosan elfogadható, a vizuális
interpretációt nem válthatja ki, de az interpretátor feladatát jelentősen megkönnyítheti.
7. 7. Javítási lehetőségek
A kapott eredményeknél kevesebb hibával járó, nagy területen, általánosan
alkalmazható, teljesen automatikus feldolgozásra alkalmas osztályozás a bemenő adatok
körének bővítésével lenne lehetséges. Több felvétel rendelkezésre állásával idősor-alapú
módszert lehetne kidolgozni, illetve változáskövető vizsgálatra is lehetőség lenne.
Ugyanakkor ilyen felbontásban nem áll rendelkezésre több különböző időpontban
készült felvétel (idősor-alapú elemzéshez egyazon évben, meghatározott
időintervallumokban készült felvételek szükségesek). A rendelkezésre álló HR
felbontású felvételek térbeli részletességük miatt nem alkalmazhatóak. Más
megközelítésben a feladat specializálásával, a vizsgálandó területek jellegének
szűkítésével javítható lehet az eredmény.
- 62 -
8. Vörösiszap-elöntés (katasztrófa-felmérés)
Már említettük, hogy a távérzékelés egyik fontos feladata a légi- vagy űrfelvételeken
látható környezeti és ipari katasztrófák felmérése. A FÖMI-ben ár- és belvízfelmérés,
aszályfelmérés, valamilyen kártevő (pl. gyapjaspille) kártételének vizsgálata rendszeres
feladatok. A rendszeresen megismétlődő természeti katasztrófák mellett előfordulnak
egyedi események is, melyeknek távérzékeléssel vizsgálható környezeti hatásuk van.
Ilyen esemény történt 2010. október 4-én Ajka mellett, amikor a Magyar Alumínium
Zrt. egyik zagytározójának (X. kazetta) gátja átszakadt, és a tárolt erősen lúgos
kémhatású vörösiszap egy része elöntötte a környező területet. Az elöntés érintette
három település belterületét, mezőgazdasági területeket, vízbázisokat, valamint a Torna
patakon keresztül a Marcal és a Duna folyókat is. A FÖMI-ben végrehajtott katasztrófa-
felmérés többek között a terület méretét, a részben vagy egészben elöntött
mezőgazdasági parcellák jellemzőit vizsgálta. E vizsgálatok keretében végeztem
objektum alapú elemzéseket szuperfelbontású űrfelvételeken. Munkám elsősorban
kutató jellegű, nem operatív felhasználásra készült (a felvételek késői időpontja, és
hiányos fedésük miatt), de összehasonlítható terepi felmérésből, légifelvételezésből
nyert adatokkal.
8. 1. A felhasznált felvételek
Az időjárási viszonyok miatt felhasználható VHR felvétel csak napokkal a
katasztrófa után készült.
Az első felvétel: 2010. október 9-én készült 8 sávos, 2m felbontású WorldView2
(WV2) felvételből előállított toa-reflektancia kép. A felvétel spektrális felbontása is
nagyon jó, a látható tartomány mellett egy vörös-határ (a látható és közeli infravörös
tartomány határa), két közeli infravörös, valamint a látható kék tartományhoz közeli,
rövidebb hullámhossz-tartományban érzékelő sáv áll rendelkezésre. A sávok név
szerint: 1. coastal, 2. blue (kék), 3. green (zöld), 4. yellow (sárga), 5. red (vörös), 6. red-
edge (vörös-határ), 7. near infrared 1 (közeli infravörös), near infrared 2, ez utóbbiakat
- 63 -
nir1 és nir2-vel rövidítem. A coastal sáv elsősorban nyílt vizek vizsgálatakor
használható, ezt illetve a nir2 sávot a feldolgozás folyamán érdemben nem használtam.
A cél az elöntés minél pontosabb lehatárolása volt, ezért a felvétel területi felbontása
jobban kihasználható, mint a spektrális gazdagsága. A felvétel gyakorlatilag felhőtlen,
ugyanakkor nem fedi a teljes elöntött területet. Egyes területeken kivehető a katasztrófa
utáni első helyreállítási munkálatok hatása is.
A második felvétel: 2010. október 7-én készült RapidEye felvétel, melynek térbeli
felbontás 5m, 5 spektrális sávban felvételez: 1. kék, 2. zöld, 3. vörös, 4. vörös-határ, 5.
közeli infravörös. A felvétel felhős, a felhővel takart, illetve árnyékolt területeken a
felvétel nem feldolgozható.
A feldolgozás részét képezte a két felvétel különbségéből adódó eltérések
vizsgálata. A módszert a WV2 felvételen dolgoztam ki, majd azt átültettem a RapidEye
felvételre is.
8. 2. A feldolgozás folyamata
A végeredményként kiadott tematikus térkép egyszerű elöntéstérkép, azaz nincs
az elöntött terület jellege szerint kategóriákra bontva. Az osztályozás megkönnyítése
végett bevezettem ideiglenes kategóriákat az elöntés mértéke és az elöntött terület
jellege (talaj, növényzet) alapján, de ez csak a felvételen látható viszonyok alapján
történt, terepi felmérésből vagy mezőgazdasági adatbázisból származó megerősítés
nélkül.
8. 3. Spektrális indexek
Egy fontos spektrális index, az NDVI alkalmazásáról a fák lehatárolásánál már
volt szó. Index az NDVI-hoz hasonló módon más sávokból is képezhető, gyakran
használunk például talaj- és nedvesség-indexeket (NDSI, NDWI), bár ezekhez a most
használt felvételtípusokon nem lévő közepes infravörös sáv szükséges. Ugyanakkor a
WV2 felvétel spektrális gazdagsága további indexek alkalmazására ad lehetőséget. A
lehetséges sávok kiválasztása többféle módon történhet, vizsgálhatjuk statisztikai
- 64 -
módszerekkel az egyes sávok kovarianciáját, ezek különbségét a felvételen előforduló
különböző felszínborítási elemek esetén. Célszerű ezt az utat követni, ha a feldolgozás
többször alkalmazandó. Jelen esetben egyszeri alkalmazásról van szó, a használandó
indexeket statisztikai módszer helyett a spektrális tulajdonságok vizuális értékelése
alapján választottam ki. Ez egy térinformatikai software, az ERDAS Imagine 9.1.
segítségével történt. Első lépésben mintaterületeket választottam a felvételen, arra
törekedve, hogy minden érdekes felszíni objektumból legyen minta. Ezen minták
spektrális tulajdonságait vizsgálva a cél olyan sáv-párok megtalálása, melyek
együttváltozása jól jellemzi az adott felszínborítást. A választás a következő indexekre
esett: ndvi (a nir1 sávból), vörös - zöld és a vörös - vörös-határ sávokból képzett
indexek. A látható vörös többszöri jelenléte a vizsgált esemény jellege miatt is várható
volt. A feldolgozás első lépéseként a megfelelő sávokból a már említett módon
létrehozzuk ezen spektrális indexeket.
8. 4. Szegmentálás
A szegmensek létrehozásakor elsődleges cél a felszínborítási objektumok, illetve
az elöntés határának szigorú követése a szegmenshatárokkal. Másodlagos célként
szegmenseken belüli homogenitásra törekedtünk.
Már többször említettem, hogy az alkalmazható módszerek és a
paraméterezhetőség sokrétűsége miatt az optimális végeredményt kísérletezéssel, a
paraméterek módosításával, többféle szegmentálás összekapcsolásával érhetjük el.
A több lépésben történő finomítással a várt eredmény fokozatos közelítése a cél.
A felvétel mérete és a szegmentálás memóriaigénye miatt itt is alkalmazzuk a már
említett „Tiling and Stitching” technikát, azaz a felvételt 2000x2000 pixeles darabokra
osztva szegmentálunk. Itt is megadjuk a szegmentálás lépéseit:
1. lépés: „multiresolution segmentation” a vörös - zöld és a vörös-határ - vörös
indexek alapján, (a vörös-zöld kétszeres súllyal) további paraméterek: scale = 3, shape =
0, compactness = 0,9.
- 65 -
Az első lépés még pixelszinten történik, a szegmentálás mellett az objektumok
létrehozásáért is felel. Minden további lépés az objektumok szintjén történik.
26. ábra: a szegmensek az első lépés után
Az első lépés eredménye a kitűzött célokat jól közelíti, de lokális hibák miatt további
lépésekre van szükség. A hibák olyan területeken jelentkeznek, ahol a szegmentálást
meghatározó indexek szerint homogén a terület. Először felmerülhet a gondolat, hogy
például az alábbi képen jól látható szegmentálási hiba elkerülhető lenne több sáv
bevonásával. A kísérletezés tapasztalata, hogy a hasonló lokális hibákat javítandó több
sáv szerinti szegmentálás általánosan rosszabb eredményt ad. Ezért egy második
szegmentáló lépést alkalmazunk, melyben az ilyen területeket szétvágjuk.
- 66 -
27. ábra: hibás szegmens
2. lépés: „contrast split segmentation” a felvétel zöld sávja alapján, a
paraméterezéshez a software felkínált értékeit használjuk, kivéve a step size = 2
beállítást. Ez a lépés a szegmenseket feldarabolja. A hibákat megszűnteti, ugyanakkor
számunkra érdektelen inhomogenitások felesleges felosztást eredményeznek, ezért még
egy szegmentáló lépést végzünk.
28. ábra: a szegmensek a második lépés után
- 67 -
3. lépés: „multiresolution segmentation” a vörös sáv, a vörös-zöld és a vörös-határ
- vörös indexek alapján, az első lépéssel megegyező paraméterezés mellett. A kapott
eredmény az egész felvételen elég pontosan követi az elöntés határait, az elöntésen
belüli változások követési pontossága is megfelel a célnak, további szegmentáló
lépésekre nincs szükség.
29. ábra: a szegmentálás végeredménye
8. 5. Osztályozás
Az osztályozás mintavételezéssel, maximum likelihood (ML) módszerrel történik.
A végeredmény csak egy kategória, az elöntött terület, de az osztályozási folyamatban
három célkategóriát adtam meg: nyílt iszapborítás, elöntött talaj és elöntött növényzet.
Terepi felmérés vagy más megerősítés híján e kategóriák megfelelése a valóságnak nem
igazolt, ugyanakkor a felvételen jól kivehető a három kategória eltérése. E három
kategóriát megfelelő számú mintával írjuk le. Az osztályok nem diszjunktak, de elég
szűkek ahhoz, hogy a téves osztályozások száma a lehető legkisebb legyen, egy
kategória alkalmazása mellett a hibák száma jóval nagyobb lenne. A mintákra illesztett
eloszlásokat kismértékben szükséges javítani, ez az osztályozás kis területen történő
- 68 -
tesztelésével, a függvény megfelelő módosításával elvégezhető. Az osztályozáshoz
felhasznált jellemzők: vörös, vörös-határ, nir1, nir2 sávok és a három spektrális index
átlaga, és a nir1, nir2 sávok valamint a, vörös-határ - vörös index szórása. A többi átlag
és szórás nem jellemzi jól az egyes osztályokat, de téves találatok kiszűrésére e
sávokban adhatunk fix küszöbértékeket. Az ilyen küszöb a ML módszerben 0 vagy 1
valószínűségnek felel meg.
30. ábra: az osztályozás eredménye (három kategória)
Eddig csupán spektrális jellemzőket alkalmaztunk a folyamatban, de a következő
lépésben kihasználjuk objektum alapú elemzés egyes további lehetőségeit. Egyes
területeken a nem elöntött, növényborítás nélküli talaj spektrális tulajdonságai
nagymértékben hasonlítanak elöntött területekéhez. Ez téves találathoz vezet,
ugyanakkor az ilyen szegmensek várhatóan elszigeteltek, nem kapcsolódnak helyesen
osztályozott szegmensekhez. Azaz a geometriai lehetőségeket kihasználva, a valamely
kategóriába sorolt objektummal nem határos találatokat kivesszük az eredményből.
- 69 -
8. 6. Pontosság
Mind a szegmentálás, mind az osztályozás pontosságáról elmondható, hogy a
gátszakadás helyétől távolodva romlik, ahogy a felszín jellegzetességei jobban
befolyásolják az elöntést. Egy kis területen felhőárnyék van, ott nem történik
osztályozás. Az elöntés fás területeket is érint, ahol a lombkorona teljesen eltakarja a
talajt, az osztályozás ilyen területeken nem ad eredményt. A beépített területek és az
infrastruktúra szintén nehezen kezelhetőek, a műutak például, vélhetően a
katasztrófavédelmi és helyreállítási forgalom miatt – a gépjárművek futóművei
elhordják a megszáradt iszapot – olyan helyeken is elöntöttnek tűnhetnek, amelyeket
biztosan nem érintett az áradás.
Az ilyen hibákat geometriai tulajdonságok alapján lehetőség van javítani. A
besorolt objektumokkal teljesen körülvett, de nem beosztályozott szegmenseket egy
méretkorlátig besorolhatjuk, az úthálózat szegmensei kiszűrhetőek például az objektum
vékonysága alapján.
8. 7. A RapidEye felvétel feldolgozása, összehasonlítás
A feldolgozás a WV2 felvételhez hasonlóan, de egyszerűbb lépésekkel zajlott. A
WV2 felvétel feldolgozásakor használt spektrális sávok a RapidEye felvételen is
rendelkezésre állnak, ugyanakkor figyelembe kell venni az eltérő térbeli felbontásból
származó különbségeket. A RapidEye felvételből nem áll rendelkezésre toa-reflektancia
kép, ennek előállítása bonyolult, a felvétel készítésének paraméterei (pl. napállás
szöge), valamint a szenzorra jellemző konstansok ismerete szükséges hozzá. Ettől jelen
esetben eltekinthetünk, de több felvételen ismétlendő, vagy idősor-alapú elemzések
kalibrálatlan felvételeken nem hajthatók végre.
8. 7. 1. A RapidEye felvétel szegmentálása
Egy lépésben, „multiresolution segmentation”, zöld sáv, vörös-határ - vörös, és
vörös - zöld indexek alapján (ez utóbbi kétszeres súlyozással), további paraméterezése:
scale parameter = 2, Shape = 0, Compactness = 0,9.
- 70 -
A szegmentálás eredménye általánosan megfelelő, de a felvétel gyengébb térbeli
felbontása miatt a határvonalakon nem elég pontos. A határvonal pontossága további
lépésekkel nem javítható, a határpixelek értékei ugyanis nagyobb terület (25 m2)
sugárzási átlagából származik, ez az érték pedig nem kellően determinisztikus. Ezért
további szegmentáló lépéseket nem hajtok végre.
31. ábra: a RapidEye felvétel szegmentálása
8. 7. 2. A RapidEye felvétel osztályozása
A szűkebb spektrális és térbeli lehetőségek miatt csak két alkategóriába
osztályozunk. A módszer megegyezik a WV2 esetében leírtakkal, geometriai
tulajdonságok figyelése nélkül.
- 71 -
8. 7. 3. Eredmények
A RapidEye osztályozása több téves találatot eredményez, ezek sötétebb tónusú
talajok és egyes elöntött területek spektrális tulajdonságainak egyezéséből származnak.
32. ábra: a WorldView 2 felvétel osztályozása
33. ábra: a RapidEye felvétel osztályozása (a képi háttér a WorldView2 felvétel)
- 72 -
Ezek a téves találatok geometriai úton kiszűrhetőek, bár egyes helyeken ezek az
objektumok kapcsolódnak helyesen osztályozott objektumokhoz, így a WV2
feldolgozása során használt kritérium ezen szegmensekre nem alkalmazható.
34. ábra: a RapidEye felvétel jellemző osztályozási hibái
A térbeli felbontásbeli különbség szintén megmutatkozik az eredményekben. A
WV2 osztályozása az elöntés határvonalát pontosabban követi.
A WV2 felvétel egy pixele 4 m2, míg a RapidEye felvételen ez 25 m2 területet fed le,
azaz az egyes határpixelek spektrális értékei jóval nagyobb területről származnak.
Elsősorban ebből következik a RapidEye osztályozás pontatlansága. A spektrális
felbontásbeli különbség kevésbé látványos, a téves találatok számában jelentkezik.
- 73 -
35. ábra: a WorldView2 felvétel osztályozásának geometriai pontossága
36. ábra: a RapidEye felvétel osztályozásának gyengébb geometriai pontossága
Az eredményeket bemutató képeken a háttér a RapidEye felvétel osztályozáshoz
is a WV2 valódi színes kompozitja.
- 74 -
9. Parlagfű kimutatás objektum alapon
A FÖMI egyik jelentős feladata a parlagfű-fertőzöttség elleni közérdekű védekezés
támogatása távérzékeléses módszerrel. Természetesen a városokban előforduló,
elhanyagolt kertekben, közterületen jelen lévő parlagfű nem kimutatható légi- vagy
űrfelvételeken, ugyanakkor a mezőgazdasági területeken, elsősorban kalászos tarlókon
jelentkező fertőzöttség mérhető távérzékeléssel. Megjegyzendő, hogy az ilyen,
mezőgazdasági területeken való előfordulás adja az erősen allergén növény összes hazai
megjelenésének legnagyobb hányadát.
A távérzékeléses felmérés önmagában nem elegendő a védekezési folyamat
lebonyolításához, de fontos támpont a terepi ellenőrzés elvégzéséhez.
A hagyományosan alkalmazott módszer HR felvételek idősor-elemzésével, terepi
felméréses megerősítés mellett történő pixel-alapú feldolgozás, de a 2010-es évben egy
szuperfelbontású felvételek feldolgozási lehetőségére irányuló kutatási folyamat
részeként a VHR felvételek parlagfű-kimutatásra való alkalmasságát is vizsgáltuk.
Ennek keretében objektum-alapú feldolgozást végeztem, melynek eredményeit
összevetettük képpont-alapú eredményekkel. A vizsgálat kalászos tarlókra, illetve
szójával ültetett területekre terjedt ki.
9. 1. Felhasznált felvételek
2010. szeptember 22-én Dél-Baranyáról (Villány környéke) készült WorldView2
felvételrészlet. A felvétel paraméterei az előző részben leírtakkal megegyezők.
2010. október 8-án végzett terepi felmérés eredményei, valamint a mezőgazdasági
kategória maszkok a kalászos tarlók és a szójaültetvények térbeli leválogatására.
- 75 -
9. 2. A feldolgozás folyamata
A parlagfű-kimutatás nem az objektumok egyenkénti, hanem az adott jellegű
területtől (pl. kalászos tarló) várt tulajdonságoktól való eltérés, valamint növény-okozta
texturális jellegzetességek megtalálását jelenti, ugyanis maga a növény még VHR
felbontásban sem látszik a felvételen. Az elemzéshez használt tanuló és tesztterületek
kijelöléséhez szükség volt a felvételezett területről, a felvételezés időpontjához közeli
időpontban történő terepi felméréshez. A lehetséges célterületek kijelölése az idősor-
alapú elemzés eredményei alapján történt. A terepi felmérés hagyományosan öt
kategóriát különít el, ezek valamelyikébe osztva a felmért területeket:
1. parlagfűvel erősen fertőzött
2. parlagfűvel és más gyomokkal együttesen fertőzött
3. más gyomokkal fertőzött, kis mértékben parlagfüves
4. gyomos, de nem parlagfüves
5. betárcsázott
Ezt a kategorizálást jelen estben csak részben tudjuk alkalmazni, ugyanis a felmért
terület kis méretéből adódóan az egyes kategóriákból nem érkezett kellőszámú
eredmény, illetve a betárcsázások időpontját nem ismeretük, ezért csak három
kategóriát különítettem el (1., 2-3. összevonva, 4.).
A két mezőgazdasági kategória fertőzöttségének a vizsgálata külön-külön
történik. Az elemzés az egész területre szolgáltat eredményeket, de értelmes eredményt
csak a kategórián belül várunk. Ezen területek leválasztását az ERDAS Imagine
térinformatikai programmal végezzük.
9. 3. Szegmentálás
Amint említettük, ezúttal a célobjektumok lehatárolása nem megoldható, ezért a
szegmentálás célja a mezőgazdasági táblák egymástól való elválasztása mellett a lokális
jellegzetességek, a textúrák követése. A szegmentálás egy lépésben történik:
„multiresolution segmentation” a zöld, vörös, vörös-határ, nir1, nir2 sávok és az ndvi
- 76 -
alapján (ndvi a nir1 sávból számolva). A paraméterezése: scale = 30, Shape = 0.4,
Compactness = 0.9.
37. ábra: a szegmentálás eredménye
9. 4. Osztályozás
Az osztályozás ismét mintavételezéssel, maximum likelihood módszerrel történik.
A mintákat a terepi felmérés eredményéből választottuk mindkét vizsgált
mezőgazdasági területtípusra. Ezek egy részét tesztterületként használjuk (tanuló és
tesztterületek diszjunktak).
A kalászos tarlón alkalmazott megkülönböztetett parlagfű-fertőzöttségi
kategóriák, az eredeti terepi fertőzöttségi kódoknak megfeleltetve:
1. 50% felett parlagfüves (1. kategória),
2. parlagfűvel és más gyomokkal is fertőzött (2. és 3. kategória),
3. más gyomokkal fertőzött, nem parlagfüves (4. kategória)
A szójaültetvényekről való hiányos terepi eredmények (összesen két tábla, 1-es
fertőzöttségi kóddal) miatt ezen táblákban csak 50% felett parlagfüves területeket
keresünk.
- 77 -
A szegmensek osztályba sorolásakor az egyes spektrális sávok, valamint az ndvi,
illetve nir2 - vörös-határ indexek átlaga és szórása mellett texturális jellemzőket is
figyelembe veszünk. A textúrát most a már említett Laplace-szűrő alkalmazásával
mérjük a vörös sávon.
9. 5. Pontosság
Az eljárás pontosságának mérése nehéz feladat. A tesztterületek alapján
természetesen vizsgálható és javítható az osztályozás, de terepi megerősítésre nincs
mód, továbbá nehézséget jelent, hogy a terepi felmérés egy mezőgazdasági táblát egy
kóddal jelöl, a táblán belüli eltéréseket, parlagfű-csoportosulásokat nem jelöli, illetve a
fertőzöttségi kód meghatározása sem matematikai úton történik. A célkategóriák
spektrális tulajdonságai nagymértékű átfedést mutatnak, ami szintén korlátozza az
elérhető pontosságot.
38. ábra: a parlagfüvesként osztályozott objektumok csak a kompozitban világosbarna terület (szója) eredményeit
dolgozzuk fel
A módszer hatékonysága vizsgálható a pixel-alapú elemzés eredményével
összehasonlítva. Ez a fertőzöttségi kategóriákat összevonva történt meg, azaz fertőzött -
- 78 -
nem fertőzött osztályokba sorolva. Az összehasonlítás mind a kalászos tarlókon, mind a
szójaültetvényeken végzett elemzésekben 90% feletti egyezést állapított meg.
39. ábra: a pixelenkénti (a, c) és az objektumalapú (b, d) osztályozás eredménye a kalászos tarló (a, b) és szójaföldeken (c, d)
- 79 -
10. Összegzés
Napjainkban a távérzékelés a felvételkészítő eszközök terén töretlen és lendületes
fejlődést mutat. Mára a dolgozatban bemutatottaknál nagyságrendekkel jobb geometriai
felbontású felvételek is elérhetőek. Ez a folyamat, és az ilyen felvételek specialitása
kikényszeríti a feldolgozási módszerek változását is. Az objektum-alapú képelemzés és
annak kulcslépése, a szegmentálás ugyanakkor még nem kiforrott ága a
fotogrammetriának.
A szegmentáló algoritmusok elméleti kutatása és implementálása helyett a
szakirodalomban egyre inkább átveszi a helyet a kész, de nagyon rugalmas
algoritmusokat adó eCognition programrendszer alkalmazási lehetőségeinek
bemutatása. Az objektum-alapú elemzés hatékony és eredményes alkalmazása
érdekében azonban nem feledkezhetünk meg a szegmentáló algoritmusok
megismeréséről és megértéséről sem. Az adott feladathoz legmegfelelőbb szegmentálás
végrehajtásához elengedhetetlen az egyes lépések lehetőségeinek és korlátainak,
előnyeinek és nehézségeinek mély ismerete.
A bemutatott gyakorlati alkalmazások célja a szegmensalapú elemzés
lehetőségeinek vizsgálata, az OBIA beillesztése az Intézetben végzett képfeldolgozási
módszerek közé. Az operatív alkalmazásig való eljutás azonban rögös útnak bizonyul.
A feldolgozható adatok minőségének és mennyiségének kérdését talán nem
hangsúlyoztam eléggé, de például a parlagfű-detektáló eljárás több felvétel és több
terepi adat rendelkezésre állásával tovább finomítható és eredményesebbé tehető.
Sajnos azonban az ilyen jellegű adatok esetében a nagyobb költségekre is tekintettel kell
lennünk. Ugyanakkor az Intézet egyes újabb feladatai szükségessé teszik az objektum-
alapú elemzések felhasználását, mely alkalmazások hatékonyságához a bemutatott
feladatok megoldása komoly segítség lehet mind az objektum-alapú elemzés, mind az
eCognition rendszer alkalmazási lehetőségeinek tekintetében.
- 80 -
A. Függelék
A. 1. Adatszerkezetek
Éllistás gráfreprezentáció
Legyen a G = (V, E, ω) hármas egy irányítatlan gráf. V a csúcsok, VVE ×∈ az
élek halmaza, →∈ Eω ℝ súlyfüggvény. Minden Vv∈ csúcshoz egy listát rendelünk,
melyben nyilvántartjuk az adott csúcshoz kapcsolódó éleket, és azok súlyát. Az
ábrázolás hatékony adott csúcshoz tartozó élek feldolgozásához.
40. ábra: súlyozott, irányítatlan gráf és éllistás reprezentációja
Bináris kupac
A bináris kupac fa típusú adatszerkezet, melyben a kupac tulajdonság azt jelenti,
hogy egy szülőcsúcs értéke mindig nagyobb a hozzá tartozó gyerekcsúcsok értékeinél.
A tárolás majdnem teljes (a legalsó szint kivételével mindenhol teljesen kitöltött) bináris
fában történik, a legalsó szinten balról jobbra haladva a feltöltéssel. A kupac
tulajdonságot minden módosításkor fenn kell tartani. Hatékonyan kereshető, rendezhető
adatszerkezet.
- 81 -
41. ábra: bináris kupac faként ábrázolva
A. 2. Négyfa alapú szegmentálás
A négyfa (quadtree) adatszerkezet számos, részben a távérzékeléssel is rokon
területről ismert. Fontos alkalmazása a térinformatikai adatbázisok geometriai típusú
adatainak térbeli indexelése. Ugyanakkor a módszer bizonyos korlátok között alkalmas
képszegmentálásra, elsősorban nagy erőforrás-igényű további szegmentáló lépések
előkészítésére, segítésére használhatjuk, ezt a gyakorlati alkalmazások bemutatása során
is szemléltetem. Alkalmas továbbá képek tömörítésére is.
A módszer rekurzív, az első lépésben az egész kép egy szegmens. Ezt négy
egyenlő részre osztva négy szegmenst kapunk. Minden lépésben minden szegmenst
hasonló módon négy részre vágunk, amíg az adott szegmens meg nem felel a
homogenitási kritériumnak, vagy el nem érjük a leállási feltételt (pl. maximális
szegmensszám, minimális szegmensméret). A geometriailag kötött vágások miatt
előfordulhat, hogy a fa különböző élei mentén azonos tulajdonságú szomszédos
szegmensek is keletkeznek. Ezeket egy következő szegmentáló eljárás kiküszöbölheti.
- 82 -
Irodalomjegyzék Bevezetés a távérzékelt felvételek elemzésébe: [1] Csornai G., László I.: Távérzékelt felvételek elemzése. Előadások az ELTE
Informatikai Kar Programtervező Matematikus és Programtervező Informatikus szakán, 2005-től, diasorozat.
[2] Csornai G, Dalia O. (1991) Távérzékelés. Főiskolai jegyzet, Erdészeti és Faipari
Egyetem Földmérési és Földrendezői Kar, Székesfehérvár, 1991. [3] Richard, J.A., Jia, X. (2006) Remote Sensing, Digital Image Analysis – An
Introduction. Fourth Edition. Springer-Verlag, 2006. [4] Robert A. Schowengerdt: Remote Sensing, Third Edition: Models and Methods
for Image Processing, Elsevier, 2007. Felvételek szegmentálása, szegmensalapú feldolgozása, objektumalapú elemzés: [5] R. Schoenmakers, “Integrated Methodology for Segmentation of Large Optical
Satellite Images in Land Applications of Remote Sensing,” EUR 16292 EN, European Commission, Joint Research Centre, Sept. 1995, PhD dissertation of Katholieke Universiteit Nijmegen, http://www.cs.ru.nl/ths/dissertationsSchoenmakers-phd95.ps.gz .
[6] Kettig, R. L., Landgrebe, D. A.: Classification of Multisprectral Image Data by
Extraction and Classification of Homogeneous Object. In: IEEE Transaction on Geoscience Electronics, 14(1):19-26, 1976.
[7] Pal, N.R., Pal, S.K. (1993) A Review on Image Segmentation Techniques. Pattern
Recognition, Volume 26, Issue 9, September 1993, Pages 1277-1294. [8] Shi, J., Malik, J (2000) Normalized Cuts and Image Segmentation. IEEE
Transactions on Pattern Analysis and Machine Intelligence, Volume 22, Issue 8, Aug 2000, pp: 888 – 905.
[9] Hay, G. J., Castilla, G.: Object-based Image Analysis: Strengths, Weaknesses,
Opportunities and Threaths (Swot). 1st International Conference on Object-based Image Analysis (OBIA 2006), 4-5, July, 2006, Salzburg, Austria.
[10] Haddad, S. (2007) Texture Measureas for Segmentation. Master’s Thesis,
University of Cape Town, April 2007.
- 83 -
Szegmentálás, ELTE-FÖMI közös kutatás: [11] László, G. Nádor, I. Fekete, G. Csornai, A. Kocsis: A Segment-based
Classification Method for Satellite Images. In: Proceedings of the 5th International Conference of Applied Informatics, Eger, 2001. (pp. 151-163)
[12] László, T. Pröhle, I. Fekete, G. Csornai: A Method for Classifying Satellite
Images Using Segments. Annales Univ. Sci. Budapest, Sectio Computatorica 23, 2004. (pp. 163-178)
[13] László, B. Dezső, I. Fekete, T. Pröhle: A Fully Segment-based Method for the
Classification of Satellite Images. Annales Univ. Sci. Budapest, Sectio Computatorica 30, 2009. (pp. 157-174)
[14] Giachetta, R.: Gráf alapú módszerek műholdfelvételek tematikus osztályozásában.
Tudományos Diákköri dolgozat, ELTE, Budapest, 2008. [15] Fekete I., Dezső B, László I., Ócsai K.: A szegmentálás szerepe az űrfelvételek
tematikus osztályozásában. Az „Informatika a felsőoktatásban 2008” konferencia elektronikus kiadványa, DE Informatikai Kar, Debrecen, 2008.
Definiens eCognition: [16] Definiens eCognition Developer 8, Reference Book, Definiens AG, München,
2009. [17] Definiens eCognition Developer 8, User Guide, Definiens AG, München, 2009. Saját munkák: [18] Gizella Nádor, Bernadett Csonka, Dávid Gera, Irén Hubik, Katalin Ócsai,
Zsuzsanna Suba, György Surek, Grácia Linda Tóth, Cecília Török: RAGWEED IDENTIFICATION BY WORLDVIEW2 DATA. Submitted for The DigitalGlobe 8-Band Research Challenge, 2010.
[19] Gizella Nádor, Bernadett Csonka, Dávid Gera, Irén Hubik, Katalin Ócsai,
Zsuzsanna Suba, György Surek, Grácia Linda Tóth, Cecília Török: TOXIC SPILL IN HUNGARY ON 4TH OCTOBER, 2010. Submitted for The DigitalGlobe 8-Band Research Challenge, 2010.
[20] Gábor CSORNAI, István LÁSZLÓ, Gábor MIKUS, Gizella NÁDOR, Irén
HUBIK, Katalin LIPTÁK, Mónika ANTAL, Katalin ÓCSAI, István FEKETE and Dávid GERA: The Possibilities of New Satellite Image Types in the Control of Area-based Subsidies and in Ragweed Monitoring System. 30th EARSeL Symposium "Remote Sensing for Science, Education, and Natural and Cultural Heritage", UNESCO, Paris, 31 May - 4 June 2010. -- Proceedings of EARSeL Symposium 2010, ISBN 978-3-00-033435-1,
- 84 -
[21] István László, Katalin Ócsai, Dávid Gera, Roberto Giachetta, István Fekete: Object-based Image Analysis of Pasture with Trees and Red Mud Spill. 31th EARSeL Symposium, Prague, Czech, 30 May – 2 June 2011. (Benyújtott előadás)
[22] György Surek, Gizella Nádor, Zsuzsanna Suba, Irén Hubik, Katalin Ócsai, Dávid
Gera, Cecilia Török, Grácia Linda Tóth: Comparative study of applications of satellite images with different spectral and spatial resolutions – three case studies (ragweed, toxic spill, waterlog). Three case study: ragweed, toxic spill and waterlog 31th EARSeL Symposium, Prague, Czech, 30 May – 2 June 2011. (Benyújtott előadás)