utjecaj kompresije na kvalitetu slike - banovic, jakupic, keles
TRANSCRIPT
Primjena digitalne fotografije u reprodukcijskim medijima
Katedra za grafički dizajn i slikovne informacije Grafički fakultet Sveučilišta u Zagrebu
UTJECAJ KOMPRESIJE NA KVALITETU SLIKE SEMINARSKI RAD
Nositelji kolegija i voditelj rada: Ime i prezime studenata:
Dr. sc. Maja Strgar Kurečić, doc. Tihana Banović
Matija Jakupić
Nikolina Keleš
Krešimir Korpar
prosinac, 2015.
SADRŽAJ
1. Uvod .................................................................................................................... 1
2. Teorija .................................................................................................................. 2
2.1. Digitalna fotografija ....................................................................................... 2
2.2. Formati .......................................................................................................... 3
2.3. Vrste kodiranja .............................................................................................. 4
3. Istraživanje .......................................................................................................... 7
3.1. Hipoteze ........................................................................................................ 7
3.2. Rezultati ........................................................................................................ 7
4. Zaključak ........................................................................................................... 12
5. Izvori .................................................................................................................. 13
1
1. Uvod
Kompresija slika se odnosi, između ostalog, na digitalne fotografije koje se
zapisuju u binarnom obliku na najosnovnijoj razini te ih je time kao i sve druge
računalne podatke moguće podložiti smanjenju, tj. pojednostavnjenju, u svrhu
smanjivanja prostora ili memorije koji zauzimaju na jedinici za pohranu digitalnih
podataka (hard disk, USB, memorijska kartica itd.). Ovisno o načinu na koji se neki
podatak pretvara u binarni oblik, dobiva se određeni format tih podataka.
Za pohranu fotografija koristi se mnogo različitih načina pretvorbe boja i oblika u
binarne brojeve zbog čega postoji raznoliki broj formata zapisa slike. Ovisno o
formatu, on može koristiti kompresiju podataka i može biti ili s gubitnikom (lossy) ili
bez gubitka (lossless). Najčešći formati slik su JPG, TIFF, RAW, GIF, PNG, a za
fotografije se najčešće koriste RAW i JPG.
Pretvorba bez gubitaka podataka naziva se još i nezaboravno sažimanje i pri
takvoj pretvorbi svi podaci u izvornoj slici ostaju sačuvani nakon sažimanja. Takva
fotografija ili slika je pri pohrani sačuvala sve svoje dijelove i ništa nije izgubila na
kvaliteti.
Pretvorba s gubitkom dijela podataka naziva se i zaboravno sažimanje. Pri
takvoj pretvorbi se dio podataka nepovratno gubi. Takvim postupkom se narušava
kvaliteta slike i njen izgleda, no dobiva se zapis koji zauzima puno manje memorije.
Što je više narušena kvaliteta slike, to je zapis manji. Kod pretvorbe u binarni oblik
može se izabrati optimalan omjer kvalitete izgleda slike i veličine njenog zapisa.
Kod fotografiranja, već u samom fotoaparatu se možemo odlučiti želimo li da se
nakon ekspozicije spremi neobrađena, sirova fotografija u RAW formatu, ili ćemo
dopustiti procesoru fotoaparata da ju kompresira s minimalnim gubitkom kvalitete, a
velikom razlikom u zauzetoj memoriji.
2
2. Teorija
2.1. Digitalna fotografija
Za razliku od tradicionalnih fotografija, digitalne su sačinjene od piksela, što
odmah znači da njihov prikaz uvelike ovisi o hardwareu s kojeg se promatraju. Piksel
je engleska riječ, skraćenica za picture element, tj. dio slike. Danas on može biti
prikazan sa 256 boja, kroz RGB sustav. (Slika 1.)
Veličina slika izražava se kroz količinu piksela u jednom horizontalnom i jednom
vertikalnom stupcu. Pr. 1000 x 2000 px. U fotografiji se ukupan broj piksela na slici
koristi za izražavanje kvalitete (hardwarea i slike koju će on moći proizvesti). Taj
ukupan broj se dobije množenjem svih piksela u jednom horizontalnom i vertikalnom
stupcu. Pr. 1000 x 2000 = 2 000 000 px, što se onda izražava kao 2 MP, odnosno
megapiksela.
Slika 1. Pikseli mogu postati vidljivi pri velikim uvećanjima slike
3
2.2. Formati
JPG (JPEG) je format zapisa slike koji se rabi kada koristimo manja povećanja tj.
formate fotografija, za gledanje na monitorima te kada je potrebno brzo učitavanje
fotografije i kada smo ograničeni kapacitetom memorijske kartice. On je format
zapisa sa gubitkom podataka (lossy). Ne podržava prozirnost ili animaciju. Prilikom
obrade se smanjuje kvaliteta izvornih podataka (njih čine sirove svjetlosne
informacije koje su tijekom ekspozicije dospijele do senzora) te dolazi do njihove
nepovratne degradacije. Njegova kvaliteta se može regulirati na samim
fotoaparatima ili prilikom spremanja. Najveća prednost ovog formata je njegova
univerzalnost i raširena primjena. Sve platforme podržavaju JPG format.
RAW ili „sirovi“ format je format u kojemu fotoaparat pohranjuje sve podatke koje
je digitalni senzor zabilježio prilikom fotografiranja. S tim formatom postiže se
najveća moguća kvaliteta fotografija. Problem je to što se ne radi o univerzalnom
formatu kojeg prepoznaju sve platforme već su potrebni posebni programi za obradu
koji ga mogu očitati. U takvim se programima naknadno mogu podešavati postavke
snimanja (kontrast, zasićenje boje, oštrina, balans bijeloga), te nismo ograničeni
postavkama koje su bile namještene na fotoaparatu u vrijeme snimanje.
TIFF je format koji se koristi za ispis i tisak visoke definicije boja te predstavlja
standard u grafičkoj industriji. On se, kao i JPG, može koristi na svim računalnim
platformama i programima za obradu fotografija. U njemu su fotografije pohranjivane
ovisno o postavkama na fotoaparatu te su nepovratno izgubljeni podaci koje je
senzor fotoaparata zabilježio. Datoteke snimane u TIFF su najveće i zauzimaju
najviše mjesta tako da on nije praktičan za uobičajenu uporabu. Kod spremanja u
TIFF formatu moguće je sažeti podatke (Slika 1.). U tom slučaju radi se o sažimanju
bez gubitaka podataka te fotografija ne gubi na kvaliteti bez obzira na to koliko je
puta spremana. Ponuđene kompresije su LZW, ZIP ili JPEG.
4
Slika 2. Mogućnosti koje nudi spremanje slika u TIFF format.
2.3. Vrste kodiranja
Kodiranje, iliti kompresija, se dijeli na dvije vrste; ono kod kojeg se kvaliteta gubi
u korist smanjenja veličine datoteke, i ono koje zadržava originalnu kvalitetu i druge
(meta) podatke datoteke. Redukcija u veličini datoteke može se postići zato što na
originalu postoje određeni viškovi. Odnos veličine originalne i kompresirane datoteke
nakon lossless kodiranja može biti oko 2:1, no kod lossy kodiranja čak 50:1.
Postoje, u pravilu, tri vrste viškova koji se prvi uklanjaju kompresijom; psiho-
vizualni, inter-pikselni i viškovi kodiranja. Psiho-vizualni viškovi se odnose na detalje
na slici bez kojih bi ljudsko oko i dalje moglo percipirati kodiranu fotografiju jednako
kao i original. Inter-pikselni višak je povezan s povezanosti piksela na slici, pogotovo
onih koji su jedni pokraj drugih. Viškovi kodiranja su oni koji se mogu maknuti kasnije
spomenutim metodama, a povezani su s činjenicom da je svaki piksel kodiran na
jednaki način, te se memorija datoteke smanjuje određenim algoritmima.
5
Kod kodiranja bez gubitaka (lossless) postoji jednostavna metoda: run-length.
Bazira se na činjenici da se unutar neke datoteke nalazi puno istovrsnih podataka
koji se ponavljaju. Prilikom kodiranja program prolazi kroz datoteku, zamjenjujući
ponavljajuće znakove specijalnim znakovima (eng. token) (Slika 2.). Ta vrsta
kodiranje je vrlo brza i lako se provjerava no ima ograničene kompresijske
mogućnosti.
Slika 3. Princip rada run-length metode
Nadalje, postoji Huffman kodiranje. Bazira se na činjenici da se neki znakovi
pojavljuju češće od drugih. Na toj osnovi algoritam tvori težinsko binarno stablo.
Svakom elementu tog stabla pridružuje se nova kodna riječ koja je određena ovisno
o poziciji znaka u stablu. Znak koji se najčešće ponavlja postaje korijen stabla i
njemu se pridružuje najkraća kodna riječ. Kodna riječ najrjeđe ponavljanog znaka
može biti i dvostruko dulja od samog znaka.
Slika 4. Princip rada Huffman kodiranja
Entropijsko kodiranje zasniva se na tome da koder i dekoder sadrže jednak
rječnik metasimbola od kojih svaki metasimbol predstavlja niz ulaznih znakova. Kada
dođe do ponavljanja niza nakon što je za njega nađen simbol, on se zamjenjuje tim
simbolom. S obzirom da je rječnik sadržan u koderu i dekoderu, nije potrebno da ga
kodirani podaci sadrže.
6
Slika 5. Princip rada entropijskog kodiranja
7
3. Istraživanje
3.1. Hipoteze
Kompresija bolje sažima fotografije na kojima se nalazi mnoštvo istih
ponavljajućih podataka kao što su su iste boje ili nijanse, te tako dobivamo manje
datoteke bez velikih gubitaka na kvaliteti.
TIFF format zahtjeva najviše memorije ali njime se postiže veća kvaliteta
fotografije nego u drugim formatima. Može se sažimati bez gubitka na kvaliteti čime
se potiže manja količina podataka i manja veličina datoteke.
Prejaka kompresija značajno degradira kvalitetu fotografije. S jakom
kompresijom, fotografija se može smanjiti na manje od 2% svoje originalne veličine
memorije.
3.2. Rezultati
Na slijedećoj fotografiji primjenjena je kompresija kroz promjenu kvalitete slike u JPG formatu te spremanjem u TIFF formatima sa raznim kompresijama. Prvotno je fotografija na fotoaparatu spremljena u RAW formatu koji je iznosio 8,14 MB te se ta veličina smanjila sve do 336 KB spremanjem kao JPG najmanje kvalitete.
Slika 6. Razlika najveće i najmanje JPG kvalitete slike
8
RAW TIFF TIFF (LZW)
TIFF (ZIP)
JPG (Max)
JPG (High)
JPG (Medium)
JPG (Low)
8,14 MB 28,7 MB 12,9 MB 12,9 MB 5,85 MB 1,09 MB 516 KB 336 KB
Slika 7. Fotografija nakon kompresije
Zatim je provedeno istraživanje mogućnosti kompresije TIFF formata za 8 bitne i 16 bitne fotografije. Snimljene su četiri fotografije, od kojih su prve dvije snimane fotoaparatom Nikon D80 sa objektivom 18-70mm f/3.5-4.5 u RAW formatu (NEF format) koji je iznosio 8,14 MB. Kasnije su te fotografije spremljene kao TIFF bez kompresije te sa LZW i ZIP kompresijom. Nakon otvaranja fotografije su bile veličine od 27,43 sa 40,98 cm te 2592 sa 3872 pixela.
Slika 8. Postavke za fotografije 1 i 2
9
Dobiveni su slijedeći rezultati:
8bit 8bit LZW 8bit ZIP 16bit BEZ 16bit LZW 16bit ZIP
#1 28,7 MB 14,4 MB 14,4 MB 57,4 MB 29,0 MB 21,2 MB
#2 28,7 MB 11,8 MB 10,9 MB 54,4 MB 24,1 MB 15,5 MB
Iz dobivenih rezultata možemo zaključiti da se kompresijom u TIFF formatu postižu puno manje datoteke, a zbog činjenice da se radi o kompresiji bez gubitaka, ne gubi se na kvaliteti same fotografije.
Slijedeće dvije fotografije fotografirane su sa fotoaparatom Canon EOS 60D sa objektivom EF-S 17-55mm f/2.8 IS.također u RAW formatu (CR2). Nakon otvaranja fotografije su bile dimenzija 54,86 sa 36,58 cm te 5184 sa 3456 pixela te su u RAW formatu iznosile 51,2 MB.
10
Slika 9. Postavke za fotografije 3 i 4
8bit 8bit LZW 8bit ZIP 16bit BEZ 16bit LZW 16bit ZIP
#3 51,2 MB 19,2 MB 17,1 MB 102 MB 46,9 MB 30,6 MB
#4 51,2 MB 25,4 MB 22,8 MB 102 MB 49,5 MB 36,0 MB
11
Ovo su u Photoshopu kompresirane verzije prethodne slike. Jedna je JPEG
maximum quality, i zauzima 9MB (od početnih 23MB). Druga zauzima svega 405Kb,
a predviđena degradacija kvalitete očituje se u gradijentu neba, gdje je kodiranje po
svojoj logici izbrisalo slične tonove i spojilo ih u jedan.
12
4. Zaključak
Kompresija fotografija bila je nužan slijed u povijesti razvoja digitalne tehnologije.
Usprkos kontstantnom povećanju kapaciteta hardwarea za pohranu podataka, uvijek
postoji potreba za smanjenjem veličine datoteka koje se spremaju, pogotovo na dulje
vrijeme kako bi ih se moglo spremiti i više.
Kodiranjem slike i kontroliranjem njenog formata određujemo hoćemo li
fotografije koristiti za tisak, web ili jednostavnu pohranu. I kod kodiranja postoje
različiti načini za smanjenje podataka, pa je prednost što se i njih može određivati u
kontroliranim uvjetima.
Na kraju je samo stvar u tome koje su potrebe korisnika fotografije, te se tome
prilagođuje format i razina kompresije, koja se danas može odraditi u raznovrsnim
programima.
13
5. Izvori
1. http://repro.grf.unizg.hr/media/download_gallery/UTJECAJ%20KOMPRESIJE%20NA%20KVALITETU%20SLIKE.pdf
2. http://fotografija.hr/jpeg-jpg-raw-tiff/ 3. http://racunala.ttf.unizg.hr/files/Formati_slika.pdf 4. http://www.am.unze.ba/pzi/2010/BarucijaLejla/lossless.html 5. https://bib.irb.hr/datoteka/476956.diplomskiRad_Bedek_Vinko.pdf 6. http://digital.cs.usu.edu/~xqi/Proposal/Chapter2.pdf