Download - Komprese obrazu
Komprese obrazuKomprese obrazuAdolf KnollAdolf Knoll
Národní knihovna České republikyNárodní knihovna České republiky
Obecná schémata pro aplikaci Obecná schémata pro aplikaci kompresekomprese
Schémata jsou přizpůsobena charakteru Schémata jsou přizpůsobena charakteru reprezentovaných objektů:reprezentovaných objektů:
Bitonální obraz (1-bit, černobílý)Bitonální obraz (1-bit, černobílý) Barevný fotorealistický obrazBarevný fotorealistický obraz Smíšený dokument (obě výše uvedené Smíšený dokument (obě výše uvedené
komponenty)komponenty)
TrendyTrendy
BitonálníBitonální od CCITT Fax Gr. 3 a 4 k variantám JBIG od CCITT Fax Gr. 3 a 4 k variantám JBIG
FotorealistickýFotorealistický Bezeztrátová komprese: PNG, TIFF/LZWBezeztrátová komprese: PNG, TIFF/LZW Ztrátová: od JPEG DCT k Ztrátová: od JPEG DCT k waveletwavelet
Smíšený dokumentSmíšený dokument Aplikace obého (Mixed Raster Content – Aplikace obého (Mixed Raster Content –
Smíšený rastrový obsah – obvykle vertikálně)Smíšený rastrový obsah – obvykle vertikálně)
Jak jsou kompresní schémata Jak jsou kompresní schémata zabudována do formátů?zabudována do formátů?
Snahou je obvykle ISO TIFF (v něm jsou možné Snahou je obvykle ISO TIFF (v něm jsou možné dokonce JPEG, LZW nebo PNG) – ale to dokonce JPEG, LZW nebo PNG) – ale to nestačí, protože mohou chybět nástroje na nestačí, protože mohou chybět nástroje na konverze a zobrazeníkonverze a zobrazení
Proto jsou používány jiné vhodnější formáty, Proto jsou používány jiné vhodnější formáty, například JPEG nebo PNGnapříklad JPEG nebo PNG
Z tohoto důvodu jsme též svědky velkého Z tohoto důvodu jsme též svědky velkého rozvoje v oblasti smíšených formátů, přestože rozvoje v oblasti smíšených formátů, přestože tyto si nekladou za cíl bát normou ISOtyto si nekladou za cíl bát normou ISO
Relevantní směryRelevantní směry
Bitonální obrazBitonální obraz JBIG2 (ISO) – pokusy jednotlivých firem, naoř. LuraTech; JBIG2 (ISO) – pokusy jednotlivých firem, naoř. LuraTech;
existují i odvozené aktivity (například bitonální kompresor v existují i odvozené aktivity (například bitonální kompresor v DjVu)DjVu)
Fotorealistický obrazFotorealistický obraz wavelet JPEG2000 a některé další ne-ISO iniciativy (WI, LWF, wavelet JPEG2000 a některé další ne-ISO iniciativy (WI, LWF,
IW44, SID, Imagepower IW, …)IW44, SID, Imagepower IW, …)
Smíšený obsahSmíšený obsah DjVu, LDF a další řešení LuraTech, v minulosti Imagepower DjVu, LDF a další řešení LuraTech, v minulosti Imagepower
MRCMRC
CíleCíle
Archivace obrazuArchivace obrazu
standardizovaný standardizovaný archivní formát (TIFF, archivní formát (TIFF, JPEG, PNG, …)JPEG, PNG, …)
Dodávání obrazůDodávání obrazů
Účinnější moderní Účinnější moderní formát (JB2, MrSID, formát (JB2, MrSID, DjVu, LDF, …)DjVu, LDF, …)
Jak se vyrovnat s těmito dvěma cíli?Klíč je v zaměření projektu.
Komprese…Komprese…
Předzpracování obrazuPředzpracování obrazu KompreseKomprese Zakódování do obrazového formátuZakódování do obrazového formátu Dekódování z formátuDekódování z formátu DekompreseDekomprese Zobrazení - TiskZobrazení - Tisk
Předzpracování bitonálního obrazu - IPředzpracování bitonálního obrazu - I
Účinná schémata jsou stavěna na možnostech aplikace Účinná schémata jsou stavěna na možnostech aplikace slovníků pixelových shlukůslovníků pixelových shluků::
NNaapř.př. t teext xt jjee obr obraaz, který můžz, který můžee být int být inteerprrpreetován jtován jaako vko veelké množství lké množství obrázků jednotlivých písmobrázků jednotlivých písmeen, zn, zaatím co optím co opaakovkovaaný výskyt kný výskyt kaaždého ždého písmpísmeennee můž můžee být vyjádř být vyjádřeen souřn souřaadnicdniceemimi (x,y) (x,y) aa odk odkaazzeem nm naa slovník, vslovník, vee kt kteerém jrém jee pouz pouzee j jeedndnaa r reeprpreezzeentntaaccee podobných písm podobných písmeenn (digit(digitaalizovánlizovánaa j jeen jn jeednou jdnou jaako bitmko bitmaappaa))
Tato metoda se nazývá Tato metoda se nazývá PATTERN MATCHINGPATTERN MATCHING (porovnávání se (porovnávání se vzorem), ale…vzorem), ale…
Předzpracování bitonálního obrazu - IIPředzpracování bitonálního obrazu - II
Naskenované texty obsahují však spoustu Naskenované texty obsahují však spoustu informačního šumu ve shlucích pixelů, informačního šumu ve shlucích pixelů, představujících jedno písmeno v textu, i mimo představujících jedno písmeno v textu, i mimo něně
Proto je vhodné omezit odchylky mezi identicky Proto je vhodné omezit odchylky mezi identicky identifikovatelnými shlukyidentifikovatelnými shluky vyhlazovánívyhlazování obracení pixelůobracení pixelů odstranění šumuodstranění šumu
Vyhlazování a obracení pixelůVyhlazování a obracení pixelů
Problémy v pattern matchingProblémy v pattern matching
Česká republika
Originál nebo sken nízké kvality + špatné zpracování
Soft pattern matchingSoft pattern matching
Lepší práce se slovníky; náhrada jen tam, kde je Lepší práce se slovníky; náhrada jen tam, kde je jistota, že nebude překročen kritický práh jistota, že nebude překročen kritický práh vedoucí k nežádoucí záměně shlukůvedoucí k nežádoucí záměně shluků
Kdyby to hrozilo, je uložena další malá bitmapaKdyby to hrozilo, je uložena další malá bitmapa
Vyladění těchto mechanismů je klíčem k Vyladění těchto mechanismů je klíčem k úspěšné aplikaci ztrátové komprese bitonálního úspěšné aplikaci ztrátové komprese bitonálního obrazu.obrazu.
Jak to zjistit…Jak to zjistit…
Knihovny mají dokumenty různé kvality vč. Knihovny mají dokumenty různé kvality vč. té velmi špatnété velmi špatné
Tyto dokumenty se obtížněji zpracovávají Tyto dokumenty se obtížněji zpracovávají než kvalitní vzorky prezentované než kvalitní vzorky prezentované softwarovými firmamisoftwarovými firmami
Je třeba testovat na typických materiálech, Je třeba testovat na typických materiálech, které chceme digitalizovat v knihovnáchkteré chceme digitalizovat v knihovnách
Bitonální kompreseBitonální komprese
BezeztrátováBezeztrátová (LZW, PNG, …, CCITT Fax (LZW, PNG, …, CCITT Fax Group 3 and 4, JB2, JBIG, JBIG2, Algo Group 3 and 4, JB2, JBIG, JBIG2, Algo Vision/Luratech Vision/Luratech
Moderní ztrátová schémataModerní ztrátová schémata:: ATAT&&T (Lizardtech) (JB2) – soft pattern T (Lizardtech) (JB2) – soft pattern
matchingmatching ImagePower Inc. JBIG2 (JB2) – v minulosti - ImagePower Inc. JBIG2 (JB2) – v minulosti -
pouze pattern matchingpouze pattern matching Summus Inc. (Lightning Strike), ... Summus Inc. (Lightning Strike), ...
GIF by byl mírněhorší než PNG
Květy české – 19. stoletíKvěty české – 19. století
Vliv kvality digitalizovaných originálů na Vliv kvality digitalizovaných originálů na výkonnost kompresních schématvýkonnost kompresních schémat
JB2JB2
Nejvýkonnějším kompresním schémat je Nejvýkonnějším kompresním schémat je JB2 z formátu DjVu (ATJB2 z formátu DjVu (AT&&T/Lizardtech). T/Lizardtech).
Umožňuje kompresi:Umožňuje kompresi: bezeztrátovoubezeztrátovou ztrátovouztrátovou agresivní – nastavitelná; zachovává vysokou agresivní – nastavitelná; zachovává vysokou
čitelnost originálučitelnost originálu Zkuste si komprimovat do DjVu on-line: Zkuste si komprimovat do DjVu on-line:
http://any2djvu.djvuzone.org/http://any2djvu.djvuzone.org/
JB2 jako komponenta formátu JB2 jako komponenta formátu DjVuDjVu
Více souborů může být sloučeno a uloženo v jednom (jako Více souborů může být sloučeno a uloženo v jednom (jako v PDF) – mají společný slovník, takže jejich celkový objem v PDF) – mají společný slovník, takže jejich celkový objem bude menší než součet objemů individuálních souborůbude menší než součet objemů individuálních souborů
Více souborů může být sloučeno virtuálně (na webu jsou Více souborů může být sloučeno virtuálně (na webu jsou volány dle potřeb uživatele)volány dle potřeb uživatele)
Více výhod: display, odkazy, OCR, … (DjVu plug-in)Více výhod: display, odkazy, OCR, … (DjVu plug-in)
Drahý kódující software + řada řešení zdarmaDrahý kódující software + řada řešení zdarma
Vzorky a résuméVzorky a résumé
Je třeba monitorovat a testovat nové Je třeba monitorovat a testovat nové způsoby zpracování obrazuzpůsoby zpracování obrazu
Nové přístupy mohou být velmi vhodné Nové přístupy mohou být velmi vhodné pro systémy dodávání dokumentůpro systémy dodávání dokumentů Obrazové serveryObrazové servery Naskenovaný obsahNaskenovaný obsah KlikněteKlikněte, pokud máte zájem si přečíst , pokud máte zájem si přečíst
speciální studiispeciální studii
Které formáty jsou vhodné pro bitonální Které formáty jsou vhodné pro bitonální obraz?obraz?
Jestliže chcete nejjednodušší řešení:Jestliže chcete nejjednodušší řešení: GIFGIF Jestliže chcete menší soubory, používejte PNGJestliže chcete menší soubory, používejte PNG Oba formáty jsou doporučeny pro webOba formáty jsou doporučeny pro web
Úspornějším řešením je však TIFF/CCITT Fax Úspornějším řešením je však TIFF/CCITT Fax Gr. 4Gr. 4
Používejte DjVu/JB2, pokud chcete velmi malé Používejte DjVu/JB2, pokud chcete velmi malé souborysoubory
ProblémyProblémy
Zavedený software pro práci s obrazem obvykle Zavedený software pro práci s obrazem obvykle neobsahuje podporu pro TIFF s kódováním neobsahuje podporu pro TIFF s kódováním CCITT Fax Gr. 4CCITT Fax Gr. 4
Na druhé straně je uvedený TIFF dobře Na druhé straně je uvedený TIFF dobře zobrazitelný elementárními nástroji Windowszobrazitelný elementárními nástroji Windows
GIF a PNG podporují též větší barevnou hloubku GIF a PNG podporují též větší barevnou hloubku (GIF: 8 bitů / PNG: 24 bitů i více) – vyhněte se (GIF: 8 bitů / PNG: 24 bitů i více) – vyhněte se ukládání bitonálního obrazu ve větší barevné ukládání bitonálního obrazu ve větší barevné hloubcehloubce
DjVu – je vždy nezbytné mít na paměti výrobu a DjVu – je vždy nezbytné mít na paměti výrobu a příjem obrazu v tomto formátupříjem obrazu v tomto formátu
Ztrátová komprese – Ztrátová komprese – bitonální obrazbitonální obraz
Komprese barevného Komprese barevného obrazuobrazu
BezeztrátováBezeztrátová LZWLZW
GIF (pouze 8 bitů)GIF (pouze 8 bitů) TIFF (od verze 5.0)TIFF (od verze 5.0)
PNGPNG WaveletWavelet
JPEG2000 (JP2)JPEG2000 (JP2)
……
ZtrátováZtrátová DCT (JPEG) DCT (JPEG) Fraktální kompreseFraktální komprese WaveletWavelet
IW44IW44 LWF, WILWF, WI JPEG2000 (JP2)JPEG2000 (JP2) MrSID, …MrSID, …
V podstatě ale jde o střet klasických přístupů s technologií wavelet.
Barevný obrazBarevný obraz
DCT
wavelet
Účinnost komprese – bitonální obrazÚčinnost komprese – bitonální obraz
Účinnost komprese – barevný Účinnost komprese – barevný obrazobraz
Referenční vzorek
Jak aplikovat kompresiJak aplikovat kompresi??
Záleží na charakteru objektů v obraze:Záleží na charakteru objektů v obraze: Fotorealistický obrazFotorealistický obraz (JPEG, wavelet) (JPEG, wavelet) TText aext a jednoduchá černobílá grafika jednoduchá černobílá grafika (Fax (Fax
Group 4, JB2, …)Group 4, JB2, …) Barevná grafikyBarevná grafiky (probl (problém ztrátové komprese; ém ztrátové komprese;
je lépe bezeztrátově vje lépe bezeztrátově v PNG PNG nebonebo GIF – GIF – aplikační oblast vektorové grafikyaplikační oblast vektorové grafiky - SVG) - SVG)
Smíšený obsahSmíšený obsah ( (složená řešenísložená řešení: DjVu, LDF, : DjVu, LDF, …)…)
Nejúčinnější řešeníNejúčinnější řešení
Segmentace obrazu do dvou nebo více Segmentace obrazu do dvou nebo více skupin objektů:skupin objektů:
1.1. Objekty vhodné pro bitonální konverziObjekty vhodné pro bitonální konverzi
2.2. Objekty vhodné pro barevnou reprezentaciObjekty vhodné pro barevnou reprezentaci
Komprimovat každou skupinu zvlášť a Komprimovat každou skupinu zvlášť a potom je sloučit v jednom formátu.potom je sloučit v jednom formátu.
Horizontální segmentace/zónováníHorizontální segmentace/zónování
- TextText
- GrafikaGrafika
- FotografieFotografie
Imagepower Inc.Imagepower Inc.
Vertikální Vertikální segmentace/zónovánísegmentace/zónování
popředí popředí pozadípozadí
Lizardtech Inc. (ATLizardtech Inc. (AT&&TT))Luratech GmBHLuratech GmBH
DjVu, LDFDjVu, LDF
Bitonální versus složený obrazBitonální versus složený obraz
Šedá škálaŠedá škála
Další vlastnosti DjVuDalší vlastnosti DjVu
Více obrazů v jednom souboru:Více obrazů v jednom souboru:
jako TIFF, PDF, LDF, …, s použitím jako TIFF, PDF, LDF, …, s použitím společného slovníku pixelových shlukůspolečného slovníku pixelových shluků
virtuálně: stránky zůstanou na serveru a virtuálně: stránky zůstanou na serveru a dodána je jen ta strana, která je volánadodána je jen ta strana, která je volána
Příklad virtuálního DjVu
Obrazový soubor s několika Obrazový soubor s několika rozlišenímirozlišeními
MrSIDMrSID
V jednom souboru je (až 9) obrazů v V jednom souboru je (až 9) obrazů v různých rozlišeníchrůzných rozlišeních
Účinné ve spojení s obrazovým serveremÚčinné ve spojení s obrazovým serverem
Příklad MrSID (bez obrazového serveru)