comunicazioni elettriche iiacts.ing.uniroma1.it/comel_ii_materials_2017_2018/20171117_comel... ·...
TRANSCRIPT
Comunicazioni Elettriche II
Laurea Magistrale in Ingegneria Elettronica
Università di Roma La Sapienza
A.A. 2017-2018
Informazione associata a un’immagine
L’analisi svolta fino ad ora ci ha permesso di determinare quali informazioni dobbiamo trasmettere per trasferire il contenuto di un’immagine.
Facendo riferimento per semplicità a un’immagine in bianco e nero, si possono distinguere due casi
a) Campionamento in una sola dimensione (ad es. y)
Dobbiamo trasferire le funzioni continue di : l x ,kΔy( ) , k =0,…,N −1
b) Campionamento in due dimensioni
Dobbiamo trasferire gli campioni di luminanzaMN
l mΔx ,kΔy( ) , m=0,…,M−1
k =0,…,N −1⎧⎨⎪
⎩⎪
N x
Banda di un segnale d’immagine
Le domande successive da porre sono:
1) Come associamo l’informazione da trasmettere a un segnale monodimensionale funzione del tempo?
2) Che banda avrà questo segnale?
a) Campionamento in una sola dimensione (ad es. y)
Abbiamo detto che in questo caso possiamo trasmettere in sequenza le funzioni di corrispondenti alle righe.
Dovremo quindi associare la variabile alla variabile temporale con una sostituzione del tipo
Per la generica riga questo porterà a un segnale
xN
N
x tt =βx
sk t( ) = l t ,kΔy( ) , t ∈ 0,βXmax⎡⎣
⎤⎦
Banda di un segnale d’immagine
La scelta di determinerà il tempo necessario a trasmettere una riga
Ma che banda avrà il segnale ?
In generale dipenderà dal contenuto informativo della riga corrispondente; possiamo però decidere la banda massima ammissibile per un segnale di riga osservando che, avendo deciso di campionare in con passo , si ritiene accettabile rappresentare una colonna dell’immagine con campioni.
Equivalentemente, assumendo che si voglia ottenere la stessa qualità di rappresentazione in e , si può concludere che si dovrà allocare al segnale di riga la banda necessaria a trasferire campioni in un tempo
La banda necessaria è quindi pari a:
ΔyN
M =RN
y
x
β Tr =βXmax
sk t( )
y
Tr
B = RN2Tr
metà della frequenza di campionamento “virtuale”
fc =
RNTr
=RNβXmax
=1βΔx
Banda di un segnale d’immagine- Esempio -
Esempio
Xmax =0.2395mYmax =0.1887mΔy =3.53⋅10−4m
⎧
⎨⎪⎪
⎩⎪⎪
⇒N =535
R = 0.23950.1887 =1.2692
⎧
⎨⎪
⎩⎪
l x ,kΔy( )
Banda di un segnale d’immagine- Esempio -
sk t( ) = l t ,kΔy( ) , t ∈ 0,βXmax⎡⎣ ⎤⎦ Sk f( ) = FT sk t( )⎡⎣ ⎤⎦
β
Banda di un segnale d’immagine
dove la scelta di determinerà la banda del segnale. Nel caso di un’immagine a colori avremo tre segnali analoghi, che trasportano l’informazione delle tre componenti RGB o di luminanza+crominanza.
Il tempo di riga può essere scelto in modo arbitrario quando si deve trasferireuna singola immagine (si pensi ad esempio al servizio fax)
è al contrario vincolato nel caso in cui si debba trasferire una sequenza diimmagini poiché in questo caso per ciascuna immagine si avrà a disposizioneun tempo .In questo caso si avrà:
simm t( ) = sk t −kTr( )
k=0
N−1
∑
Il segnale che descrive l’intera immagine sarà quindi dato da:
Tr
Tf
Tr =
TfN
Tr
Banda di un segnale d’immagine
b) Campionamento in due dimensioni
In questo caso il segnale che andremo a trasmettere sarà tipicamente un segnalenumerico, di cui va preventivamente determinato il bit rate .
Dovremo quindi definire il numero di bit con cui rappresentiamo l’informazione di luminanza di ciascun pixel.
Detto ancora il tempo a disposizione per trasferire l’immagine si avrà:
fb =NM ⋅Nlum ⋅
1Tf
fb
Tf
Nlum
pixel/quadro bit/pixel
quadri/sbit/quadro
bit/secondo
Banda di un segnale d’immagine
L’estensione al caso di segnale a colori è anche in questo caso immediata: si hainfatti:
fb =NM ⋅ Nlum +Ncrom( )⋅ 1Tf
fb =NM ⋅ 3Ncom( )⋅ 1Tf
Luminanza+crominanza
Componenti RGB
Numero di bit per ciascuncampione di crominanza
Numero di bit per ciascunacomponente RGB
A partire da la banda del segnale dipenderà quindi dalla configurazione delmodulatore numerico (es. numero di livelli L e roll-off nel caso di modulatoremultilivello)
fb
Immagini in movimento
Nel caso di immagini in movimento l’emissione di ciascun punto (x, y), descrivibile ancora attraverso uno spettro di densità di potenza, varia nel tempo:
w x , y ,t ,λ( )Di conseguenza varieranno nel tempo anche le funzioni dipendenti da tale densità, in particolare la luminanza nel caso di segnali in bianco e nero:
l x , y ,t( ) = w x , y ,t ,λ( )g λ( )dλ
−∞
+∞
∫e i valori associati alle componenti di colore nel caso di segnali a colori:
R x , y ,t( ) = w x , y ,t ,λ( )r λ( )dλ0+∞
∫
G x , y ,t( ) = w x , y ,t ,λ( )g λ( )dλ0+∞
∫
B x , y ,t( ) = w x , y ,t ,λ( )b λ( )dλ0+∞
∫
Immagini in movimento
Considerando ancora il caso di immagini in bianco e nero, l’obiettivo sarà associare la funzione di luminanza a un segnale monodimensionale funzione del tempo. Ancora una volta avremo due possibilità:a) Campionare in una coordinata spaziale e in quella temporale,
ottenendo le seguenti funzioni di :x
l x ,kΔy ,lΔt( ) ,
k =0,…,N −1l∈ −∞,+∞( )
⎧⎨⎪
⎩⎪
b) Campionare in entrambe le coordinate spaziali e in quella temporale, ottenendo i campioni:
l mΔx ,kΔy ,lΔt( ) ,m=0,…,M−1k =0,…,N −1l∈ −∞,+∞( )
⎧
⎨⎪⎪
⎩⎪⎪
Spettro di un’immagine in movimento
Rimangono valide le osservazioni relativa alla scelta del passo di campionamentofatte in precedenza, ma in questo caso dobbiamo tener conto anche del
campionamento nel tempo.
Per farlo estendiamo la trasformata di Fourier multidimensionale definita in precedenza come segue:
Δy
L fx , f y , f( ) = l x , y ,t( )e− j2π xfxe− j2π yf ye− j2πtf dxdy∫∫∫ dt
L fx , f y , f( ) rappresenta quindi lo spettro del segnale di luminanza per unaimmagine in movimento
fx , f y , f( ) L fx , f y , f( )≠0La banda del segnale di luminanza sarà in questo caso il luogo dei punti
nello spazio per i quali si ha
Campionamento di un’immagine
Assumendo che sia di banda finita, tale banda individua quindi
un solido nello spazio tridimensionale su cui prende valori
fx
f y Banda di
l x , y ,t( )
f
L fx , f y , f( )l x , y ,t( )
Campionamento di un’immagine
fx
f y
Banda di
f
l mΔx ,kΔy ,lΔt( )Repliche dello spettro che si proiettano sui tre assi
Ricostruzione di segnali di immagine in movimento
Anche le condizioni da soddisfare per garantire l’assenza di aliasing possono essere facilmente estese al caso di immagini in movimento
Si noti che per ricostruire correttamente l’immagine sarà necessario un filtro ricostruttore adeguato, cioè un passabasso in
Abbiamo visto che in è l’occhio che svolge questo compito, ma cosa succede per la frequenza temporale?
Anche in questo caso è l’occhio che ricostruisce il segnale nel tempo!
Quindi l’occhio è un filtro passabasso spaziale e temporale, e rimuove sia le repliche spaziali (permettendoci di vedere l’immagine come continua, anzichésuddivisa in pixel) che quelle temporali (permettendoci di vedere un filmato anziché una serie di immagini separate nel tempo)
fx , f y , f( )
fx , f y( )
Ricostruzione di segnali di immagine in movimento
A differenza di quanto avviene per le frequenze spaziali la frequenza di taglio temporale dell’occhio non varia, ed è circa pari a
fLP =30Hz
È quindi necessario garantire che le repliche dello spettro siano distanziate tra loro in frequenza almeno di:
Δt = 1
2 f LP=16ms
fc =2 fLP =60Hz
Di conseguenza i campioni temporali della luminanza dovranno essere acquisiti con un periodo circa pari a:
Questo periodo corrisponderà al tempo a disposizione per acquisire un intero quadro, che determinerà come visto in precedenza la banda del segnale.
Tf
Standard analogici per segnali di immagine in movimento
Gli standard televisivi analogici adottati nella seconda metà del XX secolo adottavano il campionamento in y e t, generando una sequenza di segnali di luminanza per righe
I principali standard analogici sono stati:• PAL/SECAM utilizzati in Europa, Africa e Asia • NTSC utilizzato in Nord America e Giappone
Standard analogici per segnali di immagine in movimento
PAL/SECAM e NTSC condividevano molte scelte progettuali:
Trasmissione di segnali di luminanza, crominanza e audio su portanti separate, con portante di crominanza all’interno della banda del segnale di luminanza:
fflump
fcromp
faudiop
≅6MHzLa luminanza è trasmessa utilizzando uno schema di modulazione AM con Banda Laterale Ridotta, mentre la crominanza usa una modulazione AM in fase e quadratura (FM per SECAM), e FM per l’audio stereo
Standard analogici per segnali di immagine in movimento
Scansione e riproduzione dei quadri in modalità interallacciata
In questa modalità i quadri vengono divisi in due semiquadri composti dalle righe pari e dispari, che vengono riprodotti alternativamente
Ciò permette di ridurre la banda del segnale mantenendo sufficientemente elevato il refresh rate dello schermo, che è legato al tempo di semiquadro, pari alla metà del tempo di quadro:
La modalità interallacciata porta però a una riduzione della risoluzione effettiva dell’immagine, visto che le righe di ciascun semiquadro sono a distanza doppia rispetto a quelle di un quadro completo
I due standard differiscono significativamente nel numero di righe e nel tempo di quadro
Tsf =
Tf2
Tf
N
Standard analogici per segnali di immagine in movimento
Parametro PAL NTSC
625 525
1/50 s 1/60 s
4/3 4/3
64 µs 63.5 µs
5.2 MHz 4.2 MHz
TfN
R
Tr
BlumI due standard erano caratterizzati nominalmente da un numero di righe relativamente elevato
Per effetto della scansione interallacciata e per ovviare alle limitazioni dei trasduttori di destinazioni utilizzati (televisori CRT) il numero di righe effettivo era in realtà significativamente inferiore:
N
Neff
NeffPAL ≅400 Neff
NTSC ≅325
Standard numerici per segnali di immagine in movimento
Gli standard televisivi analogici sono stati progressivamente sostituiti da standard numerici, che garantiscono una migliore qualità dell’immagine e al tempo stesso una maggiore efficienza nell’uso delle frequenze.
Il processo di transizione da sistemi analogici a sistemi numerici è ormai praticamente completato in quasi tutto il mondo (switch-off analogico)
Gli standard numerici operano per definizione su un segnale numerico: al segnale di immagine in movimento (rappresentato tipicamente dai campioni di luminanza e crominanza) viene associato un flusso binario
Il flusso binario è tipicamente compresso utilizzando tecniche di codifica di sorgente definite all’interno della famiglia di standard MPEG
Il flusso binario viene quindi trasmesso sfruttando una tecnica di modulazione numerica
Compressione e codifica di sorgente
Perché abbiamo bisogno di comprimere il flusso binario attraverso degli algoritmi di codifica di sorgente?
Riprendiamo l’espressione del bit rate vista in precedenza:
fb =NM ⋅ 3Ncom( )⋅ 1Tf
Per un segnale Full HD non compresso si hanno i seguenti valori:
N =1080M =1920
Ncom =8bit /pixel1Tf=24quadri / s
⋅ fb =1920⋅1080⋅ 3⋅8( ) ⋅24 !1.19Gb/ s
IMPOSSIBILE da trasmettere senza compressione nei sistemi attuali
Standard numerici per segnali di immagine in movimento
Anche in questo caso sono stati adottati più standard:• Digital Video Broadcasting (DVB-T/DVB-T2) in Europa, Asia (eccetto
Cina e Giappone) e Oceania• Advanced Television Systems Committee (ATSC) nel Nord America• Digital Terrestrial Multimedia Broadcast (DTMB) in Cina• Integrated Services Digital Broadcasting (ISDB-T) in Giappone e Sud
America
Standard numerico DVB-T
Rilasciato nel 1997, aggiornato nel 2011 con il rilascio del DVB-T2
Strato fisico basato su OFDM (Orthogonal Frequency-Division Multiplexing)
Larghezza di banda del canale: tipicamente 7-8 MHz
……
f
1 2 3 Nsc
BRFpos
BRFpos =NscΔfsc =
1705⋅4000=6.82MHz6817⋅1000=6.82MHz
⎧⎨⎪
⎩⎪
Δfsc
Modalità 2kModalità 8k
Modulazioni disponibili su ciascuna sottoportante: QPSK, 16QAM, 64QAM
Bit rate disponibili su un canale: da 5 Mb/s a 32 Mb/s (50 Mb/s nel DVB-T2)
Standard numerico DVB-T codifica di sorgente video
Basata su due standard: MPEG-2 (H.262) e MPEG-4 Part 10 (H.264)
H.262 H.264
Risoluzione massima 1920x1080 4096x2304
Bit rate massimo 300 Mbps 800 Mbps
Bit rate tipico @ Full HD 25 Mb/s 18 Mb/s
Lo standard H.264 è ad oggi uno dei più diffusi per la codifica video per la maggiore efficienza nel comprimere flussi video ad alta definizione
Ogni generazione di standard MPEG migliora la generazione precedente con nuove tecniche
Alcuni concetti di base sono però comuni a tutti gli standard MPEG, a partire da MPEG-1
Compressione video MPEGtecniche di base
Chroma subsampling l’informazione di crominanza viene trasmessa meno frequentemente di quella di luminanza
Frame video divisi in tre classi:
I-frame - per questi frame viene trasmessa molta informazione: vengonocompressi senza basarsi sul contenuto di altri frameP-frame - compressione ottenuta codificando la differenza rispetto al frame precedenteB-frame – compressi utilizzando sia il frame precedente che il successivo
Gli I-frame sono gli unici per cui è disponibile un’informazione completa, tipicamente ne viene trasmesso uno ogni 15 frame (sono i frame utilizzati durante il “fast-forward” di un flusso video)
Compressione video MPEGcompressione di un I-frame
Trasformata DCT su blocchi
di pixel
Quantizzazione coefficienti
Compressione aggiuntiva lossless
Video buffer
Bitstream~ 1 bit/pixel per I-frame ~ 0.1 bit/pixel per P/B-frame
Standard numerico ATSC
Rilasciato nel 1996, aggiornato nel 2009
Strato fisico basato su 8 Vestigial Side Band (8VSB) , uno schema di modulazione numerico in Banda Laterale Ridotta a 8 livelli
Larghezza di banda del canale: tipicamente 6 MHz
La codifica di sorgente adotta gli stessi standard utilizzati in DVB-T:
MPEG-2 (H.262)MPEG-4 Part 10 (H.264)
Banda Laterale Superiore
Full HD, Super HD e “vero” HD…
La descrizione precedente evidenzia un concetto chiave nella compressione video numerica
A un segnale di immagine in movimento con risoluzione possono corrispondere bit rate completamente differenti a seconda di quanto è “aggressiva” la codifica di sorgente
La qualità percepita dall’osservatore dipenderà quindi non solo dalla risoluzione, ma dal bit rate a disposizione del codificatore:
MxN
HD DVB-T HD Sky SuperHDSky
Blu-Ray
Risoluzione 1920x1080 1920x1080 1920x1080 1920x1080
Bit rate 7 Mb/s 10.5 Mb/s 18 Mb/s 48 Mb/s