rappresentazione dell'informazione - moreno.marzolla.name · conversione decimale→binario...

Rappresentazione Rappresentazione dell'informazionedell'informazione

Moreno MarzollaDipartimento di Informatica—Scienza e Ingegneria (DISI)

Università di Bolognahttp://www.moreno.marzolla.name/

Rappresentazione dell'informazione 2

Logica binaria 3


Rappresentazione dell'informazione

● I moderni calcolatori elettronici rappresentano ogni tipo di informazione mediante sequenze di bit

● In realtà devono gestire informazioni di tipo non necessariamente binario– Numeri (interi, reali)– Testi (sequenze di caratteri)– Suoni, immagini, video

● Come rappresentiamo questi tipi di informazioni in un calcolatore elettronico?


Rappresentazione di numeri non negativi

● Una sequenza di N bit può rappresentare un intero non negativo in base 2

● Esempio: quanto vale 001101012?

● Risposta: 32 + 16 + 4 + 1 = 53– Si sommano i pesi corrispondenti alle cifre binarie “1”

● Con N bit possiamo rappresentare tutti gli interi appartenenti all'insieme {0, … 2N - 1}

128 64 32 16 8 4 2 1

0 0 1 1 0 1 0 1pesi

cifre binarie


Conversione decimale→binario● Si può procedere così

– Si divide il numero decimale ripetutamente per 2. – I resti della divisione danno le cifre della rappresentazione

binaria, a partire dalla cifra meno significativa

● Es: come si scrive 7410

in binario?

– 74 / 2 = 37 resto 037 / 2 = 18 resto 118 / 2 = 9 resto 09 / 2 = 4 resto 14 / 2 = 2 resto 02 / 2 = 1 resto 01 / 2 = 0 resto 1

10010102

Cifra più a destra

Cifra più a sinistra


Conversione decimale→base B

● Si può procedere così– Si divide il numero decimale ripetutamente per B – I resti della divisione danno le cifre della rappresentazione in

base B, a partire dalla cifra meno significativa● Esempio: in base 16 abbiamo le cifre 0, … 9, A, … F● Come si scrive 157

10 in base 16?

– 157 / 16 = 9 resto 13 (D)9 / 16 = 0 resto 9 (9)

15710

= 9D16


...e i numeri negativi?

● Si utilizza la rappresentazione in complemento a due● Con N bit, il valore intero x viene codificato in binario

allo stesso modo di 2N + x● Nota: 0

10 (decimale) in complemento a due si scrive

00...02C

(una stringa di N zeri)


Esempio

● Supponiamo di avere N = 4 bit, e di voler codificare il numero x = 6– 2N + x = 24 + 6 = 22

– 2210

in binario si scrive 101102

– Abbiamo a disposizione solo 4 bit, quindi scartiamo quello più a sinistra: rimane 0110

2C

● La rappresentazione in complemento a 2 di 610

coincide con la normale rappresentazione binaria– Questo vale per tutti i numeri positivi


Esempio

● Rappresentiamo x = -7 con N = 4 bit in compl. a due– 2N + x = 24 – 7 = 9

– 910

in binario si scrive 10012 quindi -7

10 = 1001

2C

● Osservazione 1– Con N bit è possibile rappresentare in complemento a due i

valori interi compresi tra -(2N-1) e 2N-1-1 (estremi inclusi)● Con N = 8 bit [-128, 127]● Con N = 16 bit [-32768, 32767]● Con N = 32 bit [-2147483648, 2147483647]

● Osservazione 2– I numeri negativi (in complemento a due) hanno sempre il

primo bit a sinistra 1; i numeri positivi hanno 0


Valori rappresentabili

● Data una stringa di N bit, quanti (e quali) numeri si possono rappresentare in complemento a due?– Es: N = 4

Comp. a due Decimale Comp. a due Decimale

0000 0 1000 -8

0001 1 1001 -7

0010 2 1010 -6

0011 3 1011 -5

0100 4 1100 -4

0101 5 1101 -3

0110 6 1110 -2

0111 7 1111 -1


Conversionecomplemento a 2 → decimale

● Si procede come per la conversione binario → decimale, con la differenza che il peso della cifra più a sinistra è -2N-1 anziché 2N-1

● Esempio: quanto vale 101101012C

?

– Risposta: -128 + 32 + 16 + 4 + 1 = -75

-128 64 32 16 8 4 2 1

1 0 1 1 0 1 0 1pesi

cifre binarie


Somma in complemento a due

● Si usano le stesse regole della somma binaria "normale"

● Calcolare 510

– 710

in compl. a due con N = 4 bit

– 510

= 01012C

– -7 si rappresenta come 24 - 7 = 16 - 7 = 910

= 10012C

● Sommando 01012C

+ 10012C

si ottiene 11102C

– Il primo bit a sinistra vale uno, quindi è un valore negativo

– Infatti 11102C

= -8 + 4 + 2 = -2


Esercizio per casa

● Determinare la rappresentazione in complemento a due con N = 4 bit dei numeri A = -3

10 e B = -5

10

● Calcolare la somma (A + B) sommando le rappresentazioni in complemento a due di A e B ottenute al punto precedente

● La somma così calcolata corrisponde al valore corretto A + B = -8 ?


Errore di overflow

● Se x e y sono due numeri con segno diverso in complemento a due con N bit– Il valore (x + y) sarà ancora rappresentabile con N bit in

complemento a due– Infatti: supponiamo che x sia positivo e y negativo

0 ≤ x ≤ 2N-1-1 -2N-1 ≤ y ≤ 0da cui (sommando membro a membro):

-2N-1 ≤ x + y ≤ 2N-1-1● Quindi: se x e y sono due numeri con segno diverso in

complemento a due con N bit, la loro somma non può generare overflow


Errore di overflow

● Se x e y hanno lo stesso segno, può verificarsi overflow. Esempio con N = 4 bit – valori rappresentabili in complemento a due: -8 ... +7

Riporto 1 0 0 01 1 1 0

2C+

1 0 0 02C

=

1 0 1 1 02C

-2 -8 = 6 ?!?!?

Riporto 0 1 1 00 0 1 1

2C+

0 1 1 02C

=

1 0 0 12C

3 + 6 = -7 ?!?!?

(-2)10

+ (-8)10

310

+ 610


Quando si verifica overflow?

● Quando entrambe le seguenti condizioni sono vere– Gli operandi hanno lo stesso segno– Il segno della somma è diverso da quello degli operandi

1 1 1 02C

+

1 0 0 02C

=

0 1 1 02C

0 0 1 12C

+

0 1 1 02C

=

1 0 0 12C


Rappresentazione di numeri reali

● Come rappresentiamo un numero reale (“con la virgola”), come ad es. 34,765

10?

● Usiamo la notazione scientifica normalizzata:– 34,765 = 3,4765 × 101

– 0,007653 = 7,653 × 10-3

● Osserviamo che

3,4765 = 3×10-0 + 4×10-1 + 7×10-2 + 6×10-3 + 5×10-4


Rappresentazione di numeri reali● Lo stesso si può applicare anche per la base 2

1,1012 = 1´20 + 1´2-1 + 0´2-2 + 1´2-3 = 1,8125

10

● Possiamo scrivere un numero reale diverso da zero in base 2 come

Dove:– mmm.. sono le cifre della parte frazionaria della mantissa– eee... rappresenta l'esponente

● Non si usa la rappresentazione in complemento a due, bensì la notazione “con bias”, vedi lucido seguente

±1,mmm ...×2e e e ...


Rappresentazione di numeri reali

● Solitamente si usa un numero fisso di cifre per la mantissa e per l'esponente– Es: standard IEEE 754 singola precisione: 32 bit totali così

suddivisi

s eeeeeeee mmmmmmmmmmmmmmmmmmmmmmm

Esponente si converte in intero

senza segno e si sottrae 127

Mantissa normalizzata dopo la virgola (prima della virgola si

assume 1)

Segno0 = positivo1 = negativo

1 bit 8 bit 23 bit


Esempio

● Valore: -1.6875 ´ 2-3 = -0,210937510

1 0111 1100 101 1000 0000 0000 0000 0000

Segno: -

Esponente: 0111 11002 = 124

10

12410

– 12710

= -310

Mantissa: 1,10112 = 1.6875

10


Riepilogo

● Rappresentazione in base 2– Interi positivi– Interi positivi e negativi (complemento a due)– Valori reali

● Che dire di altri tipi di informazione?– Caratteri alfanumerici– Suoni– Immagini– ...– Le istruzioni eseguite dalla CPU


Codifica dei caratteri

● Quanti simboli dobbiamo rappresentare?– 26 lettere minuscole– 26 lettere maiuscole– 10 numeri (0—9)– simboli vari (%, $, “...)– alcuni caratteri di controllo (Return, Canc, Insert...)

● La codifica ASCII usa 7 bit per codificare 27 = 128 caratteri diversi– Dato che i calcolatori moderni lavorano con Byte di 8 bit, si usa la

codifica ASCII estesa (extended ASCII) che usa 8 bit per carattere● La codifica UNICODE usa 8, 16 o 32 bit

– Con 32 bit si possono identificare 232 = 4 294 967 296 simboli diversi


"ASCII-Table-wide" by ASCII-Table.svg: ZZT32derivative work: LanoxxthShaddow - ASCII-Table.svg. Licensed under Public Domain via Wikimedia Commons - https://commons.wikimedia.org/wiki/File:ASCII-Table-

wide.svg#/media/File:ASCII-Table-wide.svg

ASCII = American Standard Code for Information Interchange


Da ricordare

● Le lettere minuscole hanno codici consecutivi– 'a' = 97, 'b' = 98, 'c' = 99, ...

● Le lettere maiuscole hanno codici consecutivi– 'A' = 65, 'B' = 66, 'C' = 67, ...

● I numeri hanno codici consecutivi– '0' = 48, '1' = 49, '2' = 50, ...


Codifica di immagini

● Le immagini non sono formate da “sequenze” di oggetti ben definiti come i numeri e i testi

● Per poterle rappresentare bisogna prima “discretizzarle”– Cioè trasformarle in un insieme di parti “discrete” che

possono essere codificate con sequenze di bit● Consideriamo prima immagini fisse (foto etc …)


Immagini bitmap

● L’immagina viene scomposta in una griglia di elementi detti pixel (da picture element)

Immagine originale Rappresentazione bitmap


Immagini bitmap

● Ciascun pixel di una immagine in bianco e nero può essere rappresentato da un singolo bit– Ad es., 0 = bianco, 1 = nero

00000000000000000000000000000000000000000000000000000111110000000000100000100000000100101001000000010000000100000001010001010000000100111001000000001000001000000000011111000000

00000000 0000000000000000 0000000000000000 0000000000000111 1100000000001000 0010000000010010 1001000000010000 0001000000010100 0101000000010011 1001000000001000 0010000000000111 11000000


Immagini bitmap

● Immagini a toni di grigio– Un Byte per pixel (0=bianco, 255=nero, gli altri valori

rappresentano toni intermedi di grigio)● Immagini a colori: più bit (es., 3 Byte) per pixel

– 1 Byte per la componente Rossa (0—255) – 1 Byte per la componente Verde (0—255) – 1 Byte per la componente Blu (0—255)

10

24

191


Immagini vettoriali● L'immagine è descritta mediante primitive geometriche

(linee, cerchi, poligoni...) di cui si specificano i parametri

By Tonchino - Own work, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=23776193


Immagini bitmap vs vettoriali

● Le immagini vettoriali possono essere ingrandite a piacere senza perdita di dettaglio

● I formati vettoriali sono adatti a disegni tecnici, ma non si prestano alla rappresentazione di immagini reali (es., un volto, un paesaggio)

By The original uploader was Darth Stabro at English Wikipedia - Transferred from en.wikipedia to Commons by Pbroks13 using CommonsHelper., CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=15789788


Codifica di immagini

● La rappresentazione accurata di una immagine bitmap dipende– dal numero di pixel (definizione, o risoluzione)– dalla codifica del pixel

● …e richiede generalmente molta memoria

Risoluzione N. colori Byte

Immagine Televisiva

720 ´ 625 256(8 bpp)

440 KB

Telev. 4K 3840 ´ 2160 4096(12 bpp)

~ 12 MB

Foto 15000 ´ 10000 16 milioni(24 bpp)

~ 430 MB

bpp = bit per pixel

https://commons.wikimedia.org/w/index.php?curid=23776193


Esercizio

● Una immagine ha una risoluzione di 1800 ´ 1200 pixel; ogni pixel può avere un colore scelto tra 65536 colori possibili

● Quanti Byte sono necessari per codificare l'immagine?– Ipotizzare che il colore di un pixel sia rappresentato con il

minimo numero di bit necessari per rappresentare univocamente un intero tra 0 e 65535

– Trascurare lo spazio necessario per memorizzare la “tavolozza dei colori”

https://commons.wikimedia.org/w/index.php?curid=15789788


Algoritmi di compressione

● Per “risparmiare” memoria si impiegano tecniche di compressione

● Alcuni formati comunemente usati– JPEG (immagini)– MP3, FLAC (audio)– MP4, H.263 (video)– ZIP, RAR, BZ2 (file generici)



● Algoritmi lossless (senza perdita di informazione): – Operano un cambiamento di codifica dei dati che permette di

diminuire il numero di bit necessari alla rappresentazione– Consentono di ricostruire esattamente la sequenza di dati originali a

partire dai dati compressi● Esempio: sequenza di 1 milione di caratteri scelti tra A, B, C, D

– Usando la codifica ASCII: 8 milioni di bit– Usando una codifica ad hoc a lunghezza fissa, es. A=00, B=01, C=10,

D=11: 2 milioni di bit– Supponiamo di sapere che il 90% dei caratteri sono A. Allora usando

la codifica a lunghezza variabile A=0, B=100, C=110, D=111 sono richiesti:

900 000 ´ 1 + 100 000 ´ 3 = 1 200 000 bit



● Algoritmi lossy (con perdita di informazione)– Sfruttano le caratteristiche degli oggetti da rappresentare per

scartare informazione “poco importanti“– Possono ottenere livelli di compressione elevati, ma non

consentono di ricostruire esattamente i dati originali a partire da quelli compressi

● Alcune informazioni sono eliminate dal processo di compressione– L'algoritmo JPEG sfrutta la caratteristica dell’occhio umano

di essere poco sensibile a lievi cambiamenti di colore in punti contigui, e quindi elimina questi lievi cambiamenti “appiattendo” il colore dell’immagine

● È possibile specificare mediante alcuni parametri quanto siamo disposti a perdere in qualità nel processo di compressione


Codifica di video

● Il movimento è simu-lato mostrando imma-gini fisse in sequenza (24-30 al secondo) che l’occhio umano percepisce come un continuo

● Per risparmiare spa-zio alcuni metodi di codifica memorizzano solo le “differenze” fra un fotogramma e l’altro

http://nickyguides.digital-digest.com/keyframes.htm


Codifica di suoni

● Un generico suono (o segnale analogico) è rappresentato da un'onda continua

Tempo


Codifica di suoniCampionamento

● Il segnale viene misurato ad istanti discreti– Es: 1KHz = 1000 campioni/sec = 1 campione/msec

Tempo

http://nickyguides.digital-digest.com/keyframes.htm


Codifica di suoniQuantizzazione

● Per ogni campione, il valore assunto dal segnale viene espresso con un numero finito di bit (quantizzazione)

Tempo

Segnaleoriginale

Segnale campionato e quantizzato


Codifica di suoni

● L’accuratezza della ricostruzione dipende: – da quanto sono piccoli gli intervalli di campionamento

(intervalli più piccoli → qualità migliore)– da quanti bit vengono utilizzati per descrivere il suono in

ogni campione (più bit → qualità migliore)● Gli algoritmi lossy di compressione audio sfruttano il

fatto che per l’orecchio umano suoni a basso volume sovrapposti ad altri di volume maggiore sono poco udibili e possono essere eliminati– È quello che accade nello standard MPEG Layer 3 (MP3)


Idee chiave

● Rappresentazione binaria di interi● Complemento a due● Rappresentazione di informazione non numerica● Compressione lossless e lossy● Campionamento e discretizzazione

Logica binaria 46

rappresentazione dell'informazione - moreno.marzolla.name · conversione decimale→binario...

Documents