digitalisering av text och bild - teori och praktik

24
Digitalisering av text och bild - teori och praktik Jan Buse D 504 jan.buse@hb. se Vt 05

Upload: brooks

Post on 19-Jan-2016

84 views

Category:

Documents


0 download

DESCRIPTION

Digitalisering av text och bild - teori och praktik. Jan Buse D 504 [email protected] Vt 05. Introduktion Fokus på centrala aspekter i den faktiska digitaliseringsprocessen, t ex: Teknik bakom digitala bilder (vektor- och punktgrafik) Färgdjup Bildpunkter och upplösning Syfte & urval - PowerPoint PPT Presentation

TRANSCRIPT

Digitalisering av text och bild- teori och praktik

Jan BuseD [email protected] 05

Introduktion

Fokus på centrala aspekter i den faktiska digitaliseringsprocessen, t ex:

Teknik bakom digitala bilder (vektor- och punktgrafik) Färgdjup Bildpunkter och upplösning Syfte & urval Typ av dokument Fångst Justering & efterbehandling Lagringsformat

Introduktion forts…

Att en bild är digital innebär att den är lagrad som siffror, ettor och nollor:

1110110010100011101001110 (osv, osv) =

För att digitala bilder skall kunna ses krävs programvara som kan koda om siffrorna till synliga bildelement.

Viktigt att vara medveten om att den digitala kopian är någonting annat än originalet. Det är en representation, ett surrogat, med speciella egenskaper.

En mängd faktorer i digitaliseringsprocessen styr vilka egenskaper det digitala dokumentet får.

Teknik bakom digitala bilder

Det finns endast två typer av tekniker vid skapande av digitala bilder:

Vektorgrafik

Punktgrafik

Alla digitala bilder är gjorda antingen i den ena, eller andra tekniken, eller både och.

De två teknikerna är en av de faktorer som i hög grad påverkar bildens egenskaper.

Vektorgrafik

Bilder i vektorgrafik är uppbyggda av kurvor och linjer s k vektorer. Dessa beskrivs och definieras matematiskt av ritprogrammet.

Noder

Kurva

Linje

Vid arbete i ett grafikprogram, översätts det ritade till noder och koordinater, och lagras därefter som en formel i datorn.

Utmärkande drag hos vektorgrafik

Den tar litet minnesutrymme, då bilden endast lagras som en matematisk formel.

Konturer på bilder blir helt skarpa, man slipper taggiga kanter.

Kan förstoras, förminskas och förändras hur som helst utan att kvalitén försämras = Behöver inte i förväg bestämma slutgiltig storlek, bra format att jobba i under skisstadiet.

Tekniken lämpar sig väl till bilder med hela ytor i samma färg, som text, loggor, teckningar och annan enklare grafik.

Vektorgrafik är särskilt nödvändig till bilder som skall skrivas ut på papper.

ABC…

Punkt- eller rastergrafik

Bilder som är uppbyggda med punktgrafik består av en mängd punkter, s k pixlar. Bildens minsta beståndsdel är alltså pixeln.

En bild som skapas med punktgrafik kan liknas vid att måla en bild på rutat papper genom att fylla de olika rutorna med färg.

Taggar

Pixel

En bild i punktgrafik beskrivs inte med en matematisk formel, utan genom hur många pixlar den totalt består av.

3000 pixlar

30

00

pix

lar

Bildens format är 3000 X 3000 pixlar.

Bildens totala pixelmängd är 3000 X 3000 = 900 000 pixlar

Ofta är ett viktigt värde också hur tätt pixlarna sitter. Detta anges i pixels per inch (tum), ppi, eller som dots per inch, dpi.

Punkt- eller rastergrafik forts…

Hur en digital bild kan användas styrs i hög grad av antalet bildpunkter, eller pixlar, den består av.

Vid digital fotografering och skanning bestäms hur många pixlar en bild skall ha. I skannrar går det ofta att även ange hur tätt pixlarna skall sitta.

Publicering på skärm kräver betydligt mindre antal pixlar än utskrift ellertryck på papper.

Om digitaliseringen syftar till att skapa en arkivkopia, eller ett faksimil, ställs ännu högre krav på antal pixlar som bilden behöver bestå av.

Punkt- eller rastergrafik forts…

Utmärkande drag hos punktgrafik

Minsta beståndsdel är pixeln.

Kräver mycket minne.

Redigering försämrar bildens kvalité, vilket innebär att...

En pixelbild i förväg noggrant måste anpassas till var den skall publiceras, som på nätet, i tryck, eller utskrift.

Tekniken lämpar sig för fotografier, och andra typer av bilder med jämna tonövergångar.

Alla typer av inskannat* material, och alla digitala fotade bilder (stillbild och film), samt bildmaterial på webben är i punktgrafik.

Färgdjup - punktgrafik

När en bild digitaliseras delas ”verklighetens” kontinuerliga valörskala upp i ett antal bestämda steg. För att skalan skall uppfattas som jämn, måste skillnaderna mellan varje steg vara så liten att de inte syns för det mänskliga ögat. Ett svartvitt foto kräver t ex minst 200 gråskalesteg mellan svart och vitt. Många bilder som visas på skärm har en valörskala som omfattar 256 nyanser i varje färg (d v s av primärfärgerna rött, grönt och blått).

Verklighet/originalbild, miljontals toner

Begränsad valörskala, 100-tals toner

Digitaliserad bild i bestämda tonsteg

Vid digitalisering för kulturarvsbevarande är kraven mycket höga på trovärdig återgivning av förlagans hela ton- och valörrikedom i kopian.

Färgdjup – punktgrafik forts…

Den minsta enhet som något kan lagras i, en etta eller nolla, kallas för bit.

Strängar av ettor och nollor fungerar som koder, och översätts i olika programvaror, till t ex en bokstav eller en färg:

11100100

Ju fler kombinationsmöjligheter av ettor och nollor som går att göra, desto fler olika tecken eller färger kan kodas. För att skriva text behövs ofta 8 bitar. Då kan varje ”nödvändigt” tecken i en text översättas till ettor och nollor:

82= 2 x 2 x 2 x 2 x 2 x 2 x 2 x 2= 256

Ett binärt tal med åtta bitar ger alltså 256 möjliga kombinationer. Och antalet färger en punktuppbyggd bild maximalt kan ha bestäms således av antalet tillgängliga bitar i en dator.

Det vanligaste färgdjupet när man arbetar med enklare grafik är 8 bitar/bildpunkt=256 färger.

Färgdjup – punktgrafik forts…

1 bit/bildpunkt,2 färger

4 bitar/bildpunkt,16 färger

8 bitar/bildpunkt,256 färger

Varje färg i bilden hämtas från en palett. Färgerna är s k indexerade.

Varje kombination av ettor och nollor pekar i själva verket på en bestämd position i paletten. Om positionens färg ändras, ändras samma färg i bilden.

Färgdjup – punktgrafik forts…

Det minsta rekommenderade färgdjup för att hyfsat troget återge fotografiers färg- och tonskala är 24 bitar.

En 24 bitars bild består av tre färgkanaler: rött, blått, grönt. Varje kanal förfogar över åtta bitar för att återge dess kanals färgrymd. Bilden är då i s k RGB-färgläge.

Åtta bitar =

Åtta bitar =

Åtta bitar =

828282

= 256 toner rött

= 256 toner grönt

= 256 toner blått

16, 7 milj. toner

Vid digital arkivering av kulturarv, och för att kunna göra kopior av faksimilkvalité, är det vanligtvis önskvärt med mer än åtta bitar per kanal. Vanligen rekommenderas 12, 14 eller 16 bitar per kanal. Men en bild i 16 bitar blir dubbelt så stor som en i 8 bitar...

Principer för färgvisning

Det finns olika metoder för att översätta naturliga färgers kontinuerliga valörskala, till begränsade valörskalor med bestämda steg.

Metoderna kallas färglägen eller färgmodeller, och är oftast anpassade till speciella typer av bilder och publiceringssätt.

En bilds färgläge påverkar hur många, och vilka, färger som kan återges, och styr även bildens filstorlek.

Vanliga färglägen är: NMI, RGB, CMYK, Indexerad färg, Lab-läge. Lab

RGB

CMYK

RGB och CMYK är de vanligaste färglägena för digitala färgbilder.

RGB-läget är anpassat för visning på skärm. Alla typer av bildmaterial (foton, film mm) som projiceras på skärm (dator, tv, filmduk) är i RGB-färgläget. CMYK-läget är utvecklat för bilder som skall skrivas ut eller tryckas.

Principer för färgvisning forts…

Additiv färgblandning - RGBVid färgblandning på en skärm är utgångsfärgen svart, d v s inget ljus. Olika kulörer uppstår när man ökar ljusstyrkan på skärmens tre färgkomponenter tills rätt kulör och ljusstyrka uppnås.

Subtraktiv färgblandning - CMYKVid färgblandning i tryck är utgångspunkten vitt papper och en ljuskälla som avger vitt ljus. Olika kulörer uppstår när delar av ljuskällans spektrum filtreras bort av de transparenta tryckfärgerna.

Principer för färgvisning forts…

Både RGB och CMYK är enhetsberoende. Det betyder att färger kan variera mellan olika enheter (d v s skannrar, skrivare, skärmar, kameror mm). Detta innebär att det inte finns några absoluta RGB- eller CMYK-färger.

Lab är däremot en enhetsoberoende teoretisk referensfärgrymd.

Lab-färgmodellen

A. Ljusstyrka = 100 (vitt)

B. Grönt till rött

C. Blått till gult

D. Ljusstyrka = 0 (svart)

Syfte & urval

Syftet med en digitaliseringsprocess måste var känt innan arbete börjar:

Varför digitalisera?

• Original har låg beständighet (”räddar” försvinnande kulturarv genom digitalisering)• För att förebygga nedbrytning (t ex populära dokument)• För att sprida kultur och litteratur• Marknadsföring (t ex en orts kulturhistoria)• Forskning• Kommersialism

Digitalisera vad?• Allt? (rationaliseringsaspekter)• Ett urval (det tekniskt möjliga, det mest angelägna, det mest populära?

Typ av dokument

Text, bild, tredimensionella objekt Status & format (hur digitalisera, utrustning, handhavande?)

Textdokument Det intellektuella innehållet? (räcker OCR?) Texten som bild (typsnitt, formatering, struktur, marginalanteckningar, missfärgningar, ”dold text” mm)

Bilddokument Påsikts- eller genomsiktsbilder? Positiv eller negativ? Papper, celluloid, glas etc? Monokrom eller polykrom? Extra viktiga bildelement (t ex arkitekturdetaljer, människor)?

FångstSkanner (flatbädd-, film-, trumskanner) Upplösning – optisk kontra interpolerad Histogram Elektronik (brus) Program för justering & behandling? Filmtypsinställning, automatisk maskbortagning? ”Mjuk skanning”?

Kamera (analog, digital) Pixlelmängd Optik Histogram Elektronik (brus) Lagringsformat (Jpeg, TIFF, Raw?)

OCR (dvs, programvaror för OCR) Språk Typsnitt Formatering Smuts- skadehantering

Typing (dvs, knacka in text för hand)

Ladda ned från nätet (t ex, från textarkiv)

Justering & efterbehandling

Redigering Manuell korrigering av OCR-missar

Justering Toner, färger

Efterbehandling Lyfta fram ”dold” information Rekonstruera ursprungligt utseende Retusch av skador (damm, repor, kaffe, klotter mm) Skärpa Anpassa upplösning & storlek till slutpublicering Konvertering till lämpligt lagrings- eller publiceringsformat

Lagringsformat

De vanligaste, och mest användbara, filformaten för lagring bilder ipunktgrafik är:

TIFF (Tagged Image Format File) JPEG (Joint Photographic Expert Group) GIF (Graphics Interchange Format) PNG (Portable Network Graphics)

Vid sidan av dessa format finns en rad andra, med olika egenskaper och användningsområden. Det kan röra sig om format som tillåter panorering och zoom (t ex FlashPix, MR SID, DjVu), som innehåller en rad komprimeringsalternativ (t ex JPEG2000, SPIFF, FlashPix, ), som är anpassade för speciella programvaror (t ex Photoshop .psd, Illustrator .ai).

Vad gäller vektorgrafik är följande några av de mest användbara:

AI Adobe Illustrator Mycket spritt format för vektorgrafik, fungerar både för mac och pc.

EPS (Encapsulated Postskript) Standardformat för bilder i vektorgrafik.

SVG (Scalable Vector Graphic) Är ett språk för att beskriva tvådimensionell grafik i XML.

CGM Computer Graphics Metafile Stöds av många programvaror för PC, menad som standard för vektorgrafik.

Lagringsformat forts…

Litteraturtips

Haugland, Astrid (2004) Digital bild- och fotobehandling . Sundbyberg. Pagina. 492 s.

Fulton, Wayne (1997-2005) A few scanning tips . http://www.scantips.com/(skanning, filformat, upplösning mm)

Kvalitet och standard – en praktisk vägledning vid digital bildbehandling (2001-2002) Ett samverkansprojekt mellan Kungl.biblioteket, Nationalmuseum, Riksantikvarieämbetet och Riksarkivet) http://abm.kb.se/akt4cd/def_gr.htm’