din pdf în djvu

15
1 Din PDF în DJVU (şmecherii „Open Source”) ilustrat şi explicat

Upload: iahoo

Post on 05-Jul-2015

116 views

Category:

Documents


7 download

TRANSCRIPT

Page 1: Din PDF în DJVU

1

Din PDF în DJVU(şmecherii „Open Source”)

ilustrat şi explicat

Page 2: Din PDF în DJVU

2

P r e a m b u l

1. NICIODATĂ nu încercaţi să convertaţi în "djvu" un fişier "pdf" de tip textual ("searchable", cu provenienţă din "doc", spre exemplu). Daca nu ştiţi de ce - încercaţi şi veţi înţelege. :-))))

2. Dacă sunteţi adept al codificărilor directe şi nu aveţi răbdare şi nici încredere în metodele mai sofisticate – puteţi arunca acest ghid la coşul cu gunoi (împreună cu calculatorul Dvs. :-))))

Page 3: Din PDF în DJVU

3

SumarResurse........................................................................................................................4

PDF ---> TIF (multipage)...........................................................................................5

Redactarea fişierului „TIF”........................................................................................8

Modificări avansate..................................................................................................10

Codificarea DJVU...................................................................................................13

Adăugarea cuprinsului..............................................................................................14

Page 4: Din PDF în DJVU

4

RESURSE *

-------------------------------------------* toate Open Source sau Freeware----------------------------------------------------

1. GSview & Ghostscript (gsview32.exe, version 4.7): http://www.cs.wisc.edu/~ghost/2. IrfanView (version 4.10): http://www.irfanview.net/3. Djvu Small (version 0.31): http://djvu-soft0001.nxt.ru/djvu_small_v0_3_1.rar4. (opţional) Djvu Bookmark Tool: http://windjview.sourceforge.net/bookmarks.html

GSview & Ghostscript – ceva mai mult decât un printer virtual. Îl vom folosi la convertarea fişierului PDF în TIF (multipage).

IrfanView – ceva mai mult decât un vizualizator grafic. Îl vom folosi la etapa de prelucrare a fişierului TIF (multipage).

Djvu Small – codificator DJVU. Varianta semplificată din Djvu Solo (LizardTech Inc.). Îl vom folosi în ultima etapă.

Djvu Bookmark Tool – program care permite adăugirea unui Tabel de Conţinut (TOC) în documentele DJVU, făcându-le foarte comode în utilizare.

Page 5: Din PDF în DJVU

5

PDF ---> TIF (multipage)

Scopul ultim este păstrarea calităţii originale. Întrucât suntem limitaţi de calitatea PDF-ului (care şi el este un produs al unei convertări), tot ce putem face e să avem un DJVU de calitate comparabilă (dar cu grad mai mare de compresie – de 5-10 ori).

Pachetul Ghostscript & GSview permite o transformare aproape „loossless” într-un format (TIF) acceptabil pentru soft-urile de codificare DJVU *

* există şi convertoare directe PDF-DJVU, dar nu am reuşit să obţin nici calitatea, nici compresia satisfăcătoare cu ele.

Procedeu:

1. Deschidem GSview. File--->Open--->(documentul PDF dorit):

Page 6: Din PDF în DJVU

6

2. În meniul „File” alegem opţiunea „Convert” şi setăm ca în desen:

Notă: A se fixa diapazonul de pagini la un total de cel mult 180, întrucît aceasta pare a fi limita acceptată de IrfanView la etapa următoare.

3. Selectăm „Ok”. Apare pagina de definire a numelui fisierului rezultat. Notă: (a) Insist să se dea un nume care să conţină diapazonul de pagini ales anterior – moment esenţial la etapele următoare atunci când avem documente cu peste 180 pagini. Pentru urmatorul bloc de 180 pagini, să se schimbe doar cifrele, încât să se păstreze continuitatea logică a documentului (ex: der_1-180, der_181-360, der_361-540 etc). (b) A se rezerva spaţiu suficient pe HDD, după socoteala: 1 pagină = 10 Mb

Page 7: Din PDF în DJVU

7

4. Selectăm „Ok”. Aştepăm până ce procesul se desfăşoară (5-10 min). Între timp apare pagina cu progresul activităţii:

Notă: Fişierul rezultat de regulă apare ca format „necunoscut” de sistemul de operare. Nu este o problemă, întrucât IrfanView îl va recunoaşte automat la deschidere (ca TIF).

Page 8: Din PDF în DJVU

8

REDACTAREA FIŞIERULUI „TIF”

Fişierul TIF obţinut este de tip „multipage” cu rezoluţie mare (cca 2000 x 2000). Rezoluţia mare este garantul unei codificări DJVU de calitate (tocmai de aceea fişierele grafice necomprimate – de tip TIF sau PNG – sunt cele mai preferabile).

Înainte de a fi prelucra imaginile obţinute, fragmentăm fişierul TIF unic („monolitic”) pe fişiere-pagini. În felul acesta vom avea un mai mare control la etapele succesive şi se vor preîntâmpina erori de codificare eventuale.

Procedeu:

1. Deschidem fişierul TIF-multipage în editorul IrfanView, care îl recunoaşte imediat şi ne propune să-i atribuim extensia potrivită:

2. Creăm o mapă cu acelaşi nume ca şi fişierul TIF iniţial (ex: der_1-180). 3. În meniul „Options” selectăm opţiunea

„Extract all frames...”:

Page 9: Din PDF în DJVU

9

4. Ne asigurăm că formatul pentru extras este la fel TIF (care este şi „default”). Indicăm parcursul (mapa creată la p. 2, în cazul nostru – „der_1-180”).

5. Aşteptăm până se încheie procesul (5-10 min) Notă: Fişierele-pagini rezultate sunt numerotate automat, în procesul extragerii. Este unul din avantajele exclusive ale lui IrfanView.

Page 10: Din PDF în DJVU

10

MODIFICĂRI AVANSATE

Unii parametri, aşa ca cîmpul vizibil („crop”), dimensiunile efective („resize”), trecerea la negru-alb etc. - pot fi şi ei modificaţi (opţional) în IrfanView.

Notă: (a) Toate aceste modificări se aplică automat la întreg blocul de pagini alese („batch”). Din nou, un avantaj unic al lui IrfanView şi, în acelaşi timp, o cauză a multor erori şi confuzii. (b) Nu este recomandabilă modificarea altor parametri decât cei specificaţi mai sus, întrucât pot diminua gradul de compresie DJVU la etapa finală, plus consecinţe neprevăzute.

Procedeu:

1. (opţional) Meniul cu setări se accesează prin: „File”--->”Batch Convertion/Rename”. În pagina apărută se selectează butonul „Advanced” în drept cu paragraful „Output Format”:

Notă: (a) A nu se uita ajustarea setărilor din celelalte câmpuri, după caz („Output directory”, „Add all” etc)!

(b) Se va avea grijă din timp să se creeze mapa „output” pentru fişierele redactate, cu acelaşi nume ca şi cea dinainte plus un semn distinctiv (bunăoară, o literă „b” -

der_1-180_b)

Page 11: Din PDF în DJVU

11

2. (opţional) Aplicarea noilor parametri:

(a) „CROP”: tăierea câmpurilor externe după coordonatele specificate. Notă: -- multă precauţie la tăiere, întrucât acelaşi şablon de tăiere va fi aplicat automat la toate paginile din document! -- coordonatele (X şi Y), ca şi lăţimea („width”) şi înălţimea („height”) se pot culege tot în IrfanView, în pagina principală, pentru o careva pagină (pagină „reprezentativă”) a documentului actual, selectând un chenar prin procedeul obişnuit de „drag-and-drop” care să cuprindă aria dorită (adică cea care va rămâne vizibilă după „crop”); -- datele căutate se pot culege în bara de titlu a programului, reactualizîndu-se pe măsură ce chenarul se modifică. Coordonata „X” se citeşte prima între paranteze, „Y” corespunzând celei de-a doua. (în cazul nostru 401 şi 577, respectiv – vezi desenul). „Lăţimea” se citeşte prima în perechea următoare de paranteze, a doua fiind valoarea „înălţimii” (în cazul nostru 362 şi 573, respectiv). Informaţia găsită se înscrie în câmpurile potrivite (având grijă ca căsuţa „Left top” să fie bifată).

Page 12: Din PDF în DJVU

12

(b) „RESIZE”: redimensionarea paginilor după înălţime şi/sau lăţime. Notă: -- a nu se uita să se bifeze căsuţa „Preserve aspect ratio”!-- celelalte căsuţe („Use resample function” şi „Don't enlarge smaller images”) e bine să fie şi ele bifate.-- e suficient să se indice o singură dimensiune (de regulă, doar lăţimea). În felul acesta întregul document va avea un aspect omogen şi plăcut.

(c) „Convert to greyscale”: trecerea în regim negru-alb. După preferinţă.

3. (opţional) Clik pe butonul „Start batch”. Aşteptăm pînă la încheierea procesului (5-10 min)

Notă: (a) Întotdeauna se va verifica corectitudinea parcursului indicat (localizarea mapei „output”)(b) După încheierea procesului, verificăm rezultatul, după care se pot şterge fişierele şi mapele de la etapele precedente (fişierul „TIF”-monolitic şi mapa unde s-au extras fişierele-pagini din el; în cazul nostru acestea erau fişierul „der_1-180.tif” şi mapa „der_1-180” cu toate fişierele). Rămâne doar mapa „der_1-180_b” în care au fost salvate fişierele redactate.

Page 13: Din PDF în DJVU

13

CODIFICAREA DJVU

Este etapa decisivă. Este şi cea mai durabilă (10-30 min).

Notă: (a) Înainte de a purcede la codificarea întregului document e bine să se exerseze pe un set mai mic (ex., 10 pagini) din acelaşi document. În felul acesta se poate găsi regimul optim de compresie (care este practic strict individual). (b) Orientativ, calitatea cea mai bună se obţine de regulă în regimul „Clean”. Cu cât se alege o rezoluţie mai mică, cu atît calitatea produsului va fi mai apropiată de original, iar dimensiunile fişierului mai mari.(c) În prealabil, se vor amplasa la un loc toate fişierele-pagini, într-o singură mapă (o cerinţă a Djvu Small).

Procedeu:

1. Deschidem mapa cu fişiere în programul Djvu Small.2. Alegem regimul cel mai potrivit de compresie.3. Indicăm parcursul unde fişierul rezultat va fi salvat.

Notă: Fişierul DJVU rezultat va fi denumit automat ca „Djvu encoded”. Nu uitaţi să-l re-denumiţi (există riscul să fie şters FĂRĂ AVERTISMENT la o execuţie următoare!)

Page 14: Din PDF în DJVU

14

ADĂUGAREA CUPRINSULUI

Un moment important în lecturarea cărţilor digitale este organizarea conţinutului într-o formă uşor accesibilă, aşa cum este binecunoscutul Table of Contents (TOC = „Tabelul de Conţinut”) din formatul PDF. Vestea bună e că această comoditate poate fi aplicată şi documentelor DJVU.

Notă:

Programul Djvu Bookmark Tool ataşează „Conţinutul” citindu-l dintr-un fişier tip „htm” sau „html” pe care îl creăm în mod manual, după procedeul obişnuit al limbajului HTML (dar fără „tag”-uri). Pe pagina oficială este arătat următorul exemplu de conţinut al fişierului (a) şi rezultatul final după integrarea în DJVU (b):

(a) Codul HTML (contents.htm)

<html> <body> <ul> <li><a href="#1">Link to page 1</a></li> <li><a href="#2">Link to page 2</a></li> <li><a href="#3">Chapter 1</a> <ul> <li><a href="#4">Link to page 4</a></li> <li><a href="#5">Link to page 5</a></li> </ul> </li> <li><a href="">Chapter 2, no link here</a> <ul> <li><a href="#6">Subsection</a> <ul> <li><a href="#7">Link to page 7</a></li> <li><a href="#8">Link to page 8</a></li> </ul> </li> <li><a href="#9">Link to page 9</a></li> </ul> </li> <li><a href="book.djvu#10">Link to page 10 in book.djvu</a></li> <li><a href="http://windjview.sourceforge.net">Web link</a></li> </ul> </body> </html>

(b) DJVU

Puteţi copia acest cod în Notepad şi salva în format „htm”. După un pic de exerciţiu veţi găsi varianta potrivită pentru Dvs. şi o veţi aplica cărţii dorite.

Page 15: Din PDF în DJVU

15

Procedeu:

1. Deschidem Djvu Bookmark Tool:

2. În câmpul „DjVu File” accesăm prin butonul „...” fişierul Djvu dorit.

3. În câmpul „Bookmarks” localizăm fişierul „Contents.htm” creat anterior.

4. Dăm la execuţie tastînd butonul „Save as...”, urmînd instrucţiunile.