comunicazioni elettriche iiacts.ing.uniroma1.it/comel_ii_materials_2017_2018/20171117_comel... ·...

Comunicazioni Elettriche II

Laurea Magistrale in Ingegneria Elettronica

Università di Roma La Sapienza

A.A. 2017-2018

Segnali di immagine

parte 2

Informazione associata a un’immagine

L’analisi svolta fino ad ora ci ha permesso di determinare quali informazioni dobbiamo trasmettere per trasferire il contenuto di un’immagine.

Facendo riferimento per semplicità a un’immagine in bianco e nero, si possono distinguere due casi

a) Campionamento in una sola dimensione (ad es. y)

Dobbiamo trasferire le funzioni continue di : l x ,kΔy( ) , k =0,…,N −1

b) Campionamento in due dimensioni

Dobbiamo trasferire gli campioni di luminanzaMN

l mΔx ,kΔy( ) , m=0,…,M−1

k =0,…,N −1⎧⎨⎪

⎩⎪

N x

Banda di un segnale d’immagine

Le domande successive da porre sono:

1) Come associamo l’informazione da trasmettere a un segnale monodimensionale funzione del tempo?

2) Che banda avrà questo segnale?

a) Campionamento in una sola dimensione (ad es. y)

Abbiamo detto che in questo caso possiamo trasmettere in sequenza le funzioni di corrispondenti alle righe.

Dovremo quindi associare la variabile alla variabile temporale con una sostituzione del tipo

Per la generica riga questo porterà a un segnale

xN

N

x tt =βx

sk t( ) = l t ,kΔy( ) , t ∈ 0,βXmax⎡⎣

⎤⎦


La scelta di determinerà il tempo necessario a trasmettere una riga

Ma che banda avrà il segnale ?

In generale dipenderà dal contenuto informativo della riga corrispondente; possiamo però decidere la banda massima ammissibile per un segnale di riga osservando che, avendo deciso di campionare in con passo , si ritiene accettabile rappresentare una colonna dell’immagine con campioni.

Equivalentemente, assumendo che si voglia ottenere la stessa qualità di rappresentazione in e , si può concludere che si dovrà allocare al segnale di riga la banda necessaria a trasferire campioni in un tempo

La banda necessaria è quindi pari a:

ΔyN

M =RN

y

x

β Tr =βXmax

sk t( )

y

Tr

B = RN2Tr

metà della frequenza di campionamento “virtuale”

fc =

RNTr

=RNβXmax

=1βΔx

Banda di un segnale d’immagine- Esempio -

Esempio

Xmax =0.2395mYmax =0.1887mΔy =3.53⋅10−4m

⎧

⎨⎪⎪

⎩⎪⎪

⇒N =535

R = 0.23950.1887 =1.2692

⎧

⎨⎪

⎩⎪

l x ,kΔy( )

Banda di un segnale d’immagine- Esempio -

sk t( ) = l t ,kΔy( ) , t ∈ 0,βXmax⎡⎣ ⎤⎦ Sk f( ) = FT sk t( )⎡⎣ ⎤⎦

β


dove la scelta di determinerà la banda del segnale. Nel caso di un’immagine a colori avremo tre segnali analoghi, che trasportano l’informazione delle tre componenti RGB o di luminanza+crominanza.

Il tempo di riga può essere scelto in modo arbitrario quando si deve trasferireuna singola immagine (si pensi ad esempio al servizio fax)

è al contrario vincolato nel caso in cui si debba trasferire una sequenza diimmagini poiché in questo caso per ciascuna immagine si avrà a disposizioneun tempo .In questo caso si avrà:

simm t( ) = sk t −kTr( )

k=0

N−1

∑

Il segnale che descrive l’intera immagine sarà quindi dato da:

Tr

Tf

Tr =

TfN

Tr


b) Campionamento in due dimensioni

In questo caso il segnale che andremo a trasmettere sarà tipicamente un segnalenumerico, di cui va preventivamente determinato il bit rate .

Dovremo quindi definire il numero di bit con cui rappresentiamo l’informazione di luminanza di ciascun pixel.

Detto ancora il tempo a disposizione per trasferire l’immagine si avrà:

fb =NM ⋅Nlum ⋅

1Tf

fb

Tf

Nlum

pixel/quadro bit/pixel

quadri/sbit/quadro

bit/secondo


L’estensione al caso di segnale a colori è anche in questo caso immediata: si hainfatti:

fb =NM ⋅ Nlum +Ncrom( )⋅ 1Tf

fb =NM ⋅ 3Ncom( )⋅ 1Tf

Luminanza+crominanza

Componenti RGB

Numero di bit per ciascuncampione di crominanza

Numero di bit per ciascunacomponente RGB

A partire da la banda del segnale dipenderà quindi dalla configurazione delmodulatore numerico (es. numero di livelli L e roll-off nel caso di modulatoremultilivello)

fb

Immagini in movimento

Nel caso di immagini in movimento l’emissione di ciascun punto (x, y), descrivibile ancora attraverso uno spettro di densità di potenza, varia nel tempo:

w x , y ,t ,λ( )Di conseguenza varieranno nel tempo anche le funzioni dipendenti da tale densità, in particolare la luminanza nel caso di segnali in bianco e nero:

l x , y ,t( ) = w x , y ,t ,λ( )g λ( )dλ

−∞

+∞

∫e i valori associati alle componenti di colore nel caso di segnali a colori:

R x , y ,t( ) = w x , y ,t ,λ( )r λ( )dλ0+∞

∫

G x , y ,t( ) = w x , y ,t ,λ( )g λ( )dλ0+∞

∫

B x , y ,t( ) = w x , y ,t ,λ( )b λ( )dλ0+∞

∫

Immagini in movimento

Considerando ancora il caso di immagini in bianco e nero, l’obiettivo sarà associare la funzione di luminanza a un segnale monodimensionale funzione del tempo. Ancora una volta avremo due possibilità:a) Campionare in una coordinata spaziale e in quella temporale,

ottenendo le seguenti funzioni di :x

l x ,kΔy ,lΔt( ) ,

k =0,…,N −1l∈ −∞,+∞( )

⎧⎨⎪

⎩⎪

b) Campionare in entrambe le coordinate spaziali e in quella temporale, ottenendo i campioni:

l mΔx ,kΔy ,lΔt( ) ,m=0,…,M−1k =0,…,N −1l∈ −∞,+∞( )

⎧

⎨⎪⎪

⎩⎪⎪

Spettro di un’immagine in movimento

Rimangono valide le osservazioni relativa alla scelta del passo di campionamentofatte in precedenza, ma in questo caso dobbiamo tener conto anche del

campionamento nel tempo.

Per farlo estendiamo la trasformata di Fourier multidimensionale definita in precedenza come segue:

Δy

L fx , f y , f( ) = l x , y ,t( )e− j2π xfxe− j2π yf ye− j2πtf dxdy∫∫∫ dt

L fx , f y , f( ) rappresenta quindi lo spettro del segnale di luminanza per unaimmagine in movimento

fx , f y , f( ) L fx , f y , f( )≠0La banda del segnale di luminanza sarà in questo caso il luogo dei punti

nello spazio per i quali si ha

Campionamento di un’immagine

Assumendo che sia di banda finita, tale banda individua quindi

un solido nello spazio tridimensionale su cui prende valori

fx

f y Banda di

l x , y ,t( )

f

L fx , f y , f( )l x , y ,t( )


fx

f y

Banda di

fl x ,kΔy ,lΔt( )


fx

f y

Banda di

f

l mΔx ,kΔy ,lΔt( )Repliche dello spettro che si proiettano sui tre assi

Ricostruzione di segnali di immagine in movimento

Anche le condizioni da soddisfare per garantire l’assenza di aliasing possono essere facilmente estese al caso di immagini in movimento

Si noti che per ricostruire correttamente l’immagine sarà necessario un filtro ricostruttore adeguato, cioè un passabasso in

Abbiamo visto che in è l’occhio che svolge questo compito, ma cosa succede per la frequenza temporale?

Anche in questo caso è l’occhio che ricostruisce il segnale nel tempo!

Quindi l’occhio è un filtro passabasso spaziale e temporale, e rimuove sia le repliche spaziali (permettendoci di vedere l’immagine come continua, anzichésuddivisa in pixel) che quelle temporali (permettendoci di vedere un filmato anziché una serie di immagini separate nel tempo)

fx , f y , f( )

fx , f y( )

Ricostruzione di segnali di immagine in movimento

A differenza di quanto avviene per le frequenze spaziali la frequenza di taglio temporale dell’occhio non varia, ed è circa pari a

fLP =30Hz

È quindi necessario garantire che le repliche dello spettro siano distanziate tra loro in frequenza almeno di:

Δt = 1

2 f LP=16ms

fc =2 fLP =60Hz

Di conseguenza i campioni temporali della luminanza dovranno essere acquisiti con un periodo circa pari a:

Questo periodo corrisponderà al tempo a disposizione per acquisire un intero quadro, che determinerà come visto in precedenza la banda del segnale.

Tf

Standard analogici per segnali di immagine in movimento

Gli standard televisivi analogici adottati nella seconda metà del XX secolo adottavano il campionamento in y e t, generando una sequenza di segnali di luminanza per righe

I principali standard analogici sono stati:• PAL/SECAM utilizzati in Europa, Africa e Asia • NTSC utilizzato in Nord America e Giappone


PAL/SECAM e NTSC condividevano molte scelte progettuali:

Trasmissione di segnali di luminanza, crominanza e audio su portanti separate, con portante di crominanza all’interno della banda del segnale di luminanza:

fflump

fcromp

faudiop

≅6MHzLa luminanza è trasmessa utilizzando uno schema di modulazione AM con Banda Laterale Ridotta, mentre la crominanza usa una modulazione AM in fase e quadratura (FM per SECAM), e FM per l’audio stereo


Scansione e riproduzione dei quadri in modalità interallacciata

In questa modalità i quadri vengono divisi in due semiquadri composti dalle righe pari e dispari, che vengono riprodotti alternativamente

Ciò permette di ridurre la banda del segnale mantenendo sufficientemente elevato il refresh rate dello schermo, che è legato al tempo di semiquadro, pari alla metà del tempo di quadro:

La modalità interallacciata porta però a una riduzione della risoluzione effettiva dell’immagine, visto che le righe di ciascun semiquadro sono a distanza doppia rispetto a quelle di un quadro completo

I due standard differiscono significativamente nel numero di righe e nel tempo di quadro

Tsf =

Tf2

Tf

N


Parametro PAL NTSC

625 525

1/50 s 1/60 s

4/3 4/3

64 µs 63.5 µs

5.2 MHz 4.2 MHz

TfN

R

Tr

BlumI due standard erano caratterizzati nominalmente da un numero di righe relativamente elevato

Per effetto della scansione interallacciata e per ovviare alle limitazioni dei trasduttori di destinazioni utilizzati (televisori CRT) il numero di righe effettivo era in realtà significativamente inferiore:

N

Neff

NeffPAL ≅400 Neff

NTSC ≅325

2160

3840

Evoluzione della risoluzione delle immagini

1 UHD 4 Full HD ~ 20 PAL

Standard numerici per segnali di immagine in movimento

Gli standard televisivi analogici sono stati progressivamente sostituiti da standard numerici, che garantiscono una migliore qualità dell’immagine e al tempo stesso una maggiore efficienza nell’uso delle frequenze.

Il processo di transizione da sistemi analogici a sistemi numerici è ormai praticamente completato in quasi tutto il mondo (switch-off analogico)

Gli standard numerici operano per definizione su un segnale numerico: al segnale di immagine in movimento (rappresentato tipicamente dai campioni di luminanza e crominanza) viene associato un flusso binario

Il flusso binario è tipicamente compresso utilizzando tecniche di codifica di sorgente definite all’interno della famiglia di standard MPEG

Il flusso binario viene quindi trasmesso sfruttando una tecnica di modulazione numerica

Compressione e codifica di sorgente

Perché abbiamo bisogno di comprimere il flusso binario attraverso degli algoritmi di codifica di sorgente?

Riprendiamo l’espressione del bit rate vista in precedenza:

fb =NM ⋅ 3Ncom( )⋅ 1Tf

Per un segnale Full HD non compresso si hanno i seguenti valori:

N =1080M =1920

Ncom =8bit /pixel1Tf=24quadri / s

⋅ fb =1920⋅1080⋅ 3⋅8( ) ⋅24 !1.19Gb/ s

IMPOSSIBILE da trasmettere senza compressione nei sistemi attuali

Standard numerici per segnali di immagine in movimento

Anche in questo caso sono stati adottati più standard:• Digital Video Broadcasting (DVB-T/DVB-T2) in Europa, Asia (eccetto

Cina e Giappone) e Oceania• Advanced Television Systems Committee (ATSC) nel Nord America• Digital Terrestrial Multimedia Broadcast (DTMB) in Cina• Integrated Services Digital Broadcasting (ISDB-T) in Giappone e Sud

America

Standard numerico DVB-T

Rilasciato nel 1997, aggiornato nel 2011 con il rilascio del DVB-T2

Strato fisico basato su OFDM (Orthogonal Frequency-Division Multiplexing)

Larghezza di banda del canale: tipicamente 7-8 MHz

……

f

1 2 3 Nsc

BRFpos

BRFpos =NscΔfsc =

1705⋅4000=6.82MHz6817⋅1000=6.82MHz

⎧⎨⎪

⎩⎪

Δfsc

Modalità 2kModalità 8k

Modulazioni disponibili su ciascuna sottoportante: QPSK, 16QAM, 64QAM

Bit rate disponibili su un canale: da 5 Mb/s a 32 Mb/s (50 Mb/s nel DVB-T2)

Standard numerico DVB-T codifica di sorgente video

Basata su due standard: MPEG-2 (H.262) e MPEG-4 Part 10 (H.264)

H.262 H.264

Risoluzione massima 1920x1080 4096x2304

Bit rate massimo 300 Mbps 800 Mbps

Bit rate tipico @ Full HD 25 Mb/s 18 Mb/s

Lo standard H.264 è ad oggi uno dei più diffusi per la codifica video per la maggiore efficienza nel comprimere flussi video ad alta definizione

Ogni generazione di standard MPEG migliora la generazione precedente con nuove tecniche

Alcuni concetti di base sono però comuni a tutti gli standard MPEG, a partire da MPEG-1

Compressione video MPEGtecniche di base

Chroma subsampling l’informazione di crominanza viene trasmessa meno frequentemente di quella di luminanza

Frame video divisi in tre classi:

I-frame - per questi frame viene trasmessa molta informazione: vengonocompressi senza basarsi sul contenuto di altri frameP-frame - compressione ottenuta codificando la differenza rispetto al frame precedenteB-frame – compressi utilizzando sia il frame precedente che il successivo

Gli I-frame sono gli unici per cui è disponibile un’informazione completa, tipicamente ne viene trasmesso uno ogni 15 frame (sono i frame utilizzati durante il “fast-forward” di un flusso video)

Compressione video MPEGcompressione di un I-frame

Trasformata DCT su blocchi

di pixel

Quantizzazione coefficienti

Compressione aggiuntiva lossless

Video buffer

Bitstream~ 1 bit/pixel per I-frame ~ 0.1 bit/pixel per P/B-frame

Standard numerico ATSC

Rilasciato nel 1996, aggiornato nel 2009

Strato fisico basato su 8 Vestigial Side Band (8VSB) , uno schema di modulazione numerico in Banda Laterale Ridotta a 8 livelli

Larghezza di banda del canale: tipicamente 6 MHz

La codifica di sorgente adotta gli stessi standard utilizzati in DVB-T:

MPEG-2 (H.262)MPEG-4 Part 10 (H.264)

Banda Laterale Superiore

Full HD, Super HD e “vero” HD…

La descrizione precedente evidenzia un concetto chiave nella compressione video numerica

A un segnale di immagine in movimento con risoluzione possono corrispondere bit rate completamente differenti a seconda di quanto è “aggressiva” la codifica di sorgente

La qualità percepita dall’osservatore dipenderà quindi non solo dalla risoluzione, ma dal bit rate a disposizione del codificatore:

MxN

HD DVB-T HD Sky SuperHDSky

Blu-Ray

Risoluzione 1920x1080 1920x1080 1920x1080 1920x1080

Bit rate 7 Mb/s 10.5 Mb/s 18 Mb/s 48 Mb/s

comunicazioni elettriche iiacts.ing.uniroma1.it/comel_ii_materials_2017_2018/20171117_comel... ·...

Documents