quantile based noise estimation for spectral subtraction

Upload: pritisha-punukollu

Post on 13-Apr-2018

227 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/26/2019 Quantile Based Noise Estimation for Spectral Subtraction

    1/4

    Q U A N T I L E B A S E D N O I S E E S T I M A T I O N F O R

    S P E C T R A L S U B T R A C T I O N A N D W I E N E R F I L T E R I N G

    V o l k e r S t a h l , A l e x a n d e r F i s c h e r a n d R o l f B i p p u s

    P h i l i p s R e s e a r c h L a b o r a t o r i e s

    W e i s s h a u s s t r a s s e 2 , D - 5 2 0 6 6 A a c h e n , G e r m a n y

    e m a i l : f v s t a h l , a f i s c h e r , b i p p u s g @ p f a . r e s e a r c h . p h i l i p s . c o m

    A B S T R A C T

    E l i m i n a t i o n o f a d d i t i v e n o i s e f r o m a s p e e c h s i g n a l i s a f u n -

    d a m e n t a l p r o b l e m i n a u d i o s i g n a l p r o c e s s i n g . I n t h i s p a p e r

    w e r e s t r i c t o u r c o n s i d e r a t i o n s t o t h e c a s e w h e r e o n l y a s i n g l e

    m i c r o p h o n e r e c o r d i n g o f t h e n o i s y s i g n a l i s a v a i l a b l e . T h e

    a l g o r i t h m s w h i c h w e i n v e s t i g a t e p r o c e e d i n t w o s t e p s : F i r s t ,

    t h e n o i s e p o w e r s p e c t r u m i s e s t i m a t e d . A m e t h o d b a s e d o n

    t e m p o r a l q u a n t i l e s i n t h e p o w e r s p e c t r a l d o m a i n i s p r o p o s e d

    a n d c o m p a r e d w i t h p a u s e d e t e c t i o n a n d r e c u r s i v e a v e r a g -

    i n g . T h e s e c o n d s t e p i s t o e l i m i n a t e t h e e s t i m a t e d n o i s e

    f r o m t h e o b s e r v e d s i g n a l b y s p e c t r a l s u b t r a c t i o n o r W i e n e r

    l t e r i n g . T h e d a t a b a s e u s e d i n t h e e x p e r i m e n t s c o m p r i s e s

    6 0 3 4 u t t e r a n c e s o f G e r m a n d i g i t s a n d d i g i t s t r i n g s b y 7 7 0

    s p e a k e r s i n 1 0 d i e r e n t c a r s . W i t h o u t n o i s e r e d u c t i o n , w e

    o b t a i n a n e r r o r r a t e o f 1 1 . 7 % . Q u a n t i l e b a s e d n o i s e e s t i -

    m a t i o n a n d W i e n e r l t e r i n g r e d u c e t h e e r r o r r a t e t o 8 . 6 % .

    S i m i l a r i m p r o v e m e n t s a r e a c h i e v e d i n a n e x p e r i m e n t w i t h

    a r t i c i a l , n o n - s t a t i o n a r y n o i s e .

    1 . I N T R O D U C T I O N

    T h e e r r o r r a t e o f s p e e c h r e c o g n i t i o n s y s t e m s i n c r e a s e s d r a -

    m a t i c a l l y i n t h e p r e s e n c e o f n o i s e . I t i s t h e r e f o r e i n e v i t a b l e

    t o p r o v i d e s o m e m e a n s o f n o i s e r e d u c t i o n i n t h e f r o n t e n d o f

    s p e e c h r e c o g n i z e r s w h i c h o p e r a t e u n d e r a d v e r s e c o n d i t i o n s .

    A p a r t i c u l a r l y n o i s y b u t i m p o r t a n t a p p l i c a t i o n d o m a i n o f

    s p e e c h r e c o g n i t i o n i s t h e c a r e n v i r o n m e n t 3 , 4 , 5 , 2 , 8 , 9 ] .

    I n t h i s p a p e r w e i n v e s t i g a t e d i e r e n t n o i s e r e d u c t i o n m e t h -

    o d s a n d c a r r y o u t e x p e r i m e n t s o n a l a r g e s p e e c h d a t a b a s e

    w h i c h h a s b e e n r e c o r d e d i n t h e c a r .

    T h e p a p e r i s s t r u c t u r e d a s f o l l o w s : I n S e c t i o n 2 w e g i v e

    a b r i e f d e s c r i p t i o n o f t h e s p e e c h r e c o g n i t i o n s y s t e m a n d t h e

    d a t a b a s e u s e d f o r t h e e x p e r i m e n t s . M o d e l a s s u m p t i o n s o n

    t h e s p e e c h a n d n o i s e s i g n a l a r e s t a t e d i n S e c t i o n 3 . I n S e c -

    t i o n 4 w e d i s c u s s t w o m e t h o d s t o e s t i m a t e t h e n o i s e p o w e r

    s p e c t r u m . T h e r s t m e t h o d i s b a s e d o n f r a m e w i s e s p e e c h /

    n o n - s p e e c h c l a s s i c a t i o n a n d r e c u r s i v e a v e r a g i n g o v e r n o n -

    s p e e c h f r a m e s . A s p a u s e d e t e c t i o n i n n o i s y e n v i r o n m e n t s

    i s a d i c u l t p r o b l e m , w e p r o p o s e a s e c o n d m e t h o d , w h i c h

    d o e s n o t d e p e n d o n a c l a s s i e r . T h e n o i s e i s e s t i m a t e d a s a

    t e m p o r a l q u a n t i l e i n t h e p o w e r s p e c t r a l d o m a i n . A c c o r d i n g

    t o a n e x p e r i m e n t a l c o m p a r i s o n , q u a n t i l e b a s e d n o i s e e s t i -

    m a t i o n p e r f o r m s s i g n i c a n t l y b e t t e r , e s p e c i a l l y u n d e r n o n -

    s t a t i o n a r y n o i s e . I n S e c t i o n 5 w e a p p l y s p e c t r a l s u b t r a c t i o n

    a n d W i e n e r l t e r i n g t o e l i m i n a t e t h e e s t i m a t e d n o i s e f r o m

    t h e i n p u t s i g n a l . T h e r e s u l t s a r e s u m m a r i z e d i n S e c t i o n 6 .

    2 . D A T A B A S E A N D S P E E C H R E C O G N I T I O N

    S Y S T E M

    T h e e x p e r i m e n t a l r e s u l t s r e p o r t e d i n t h i s p a p e r a r e b a s e d

    o n t h e G e r m a n d i g i t s t r i n g s u b s e t o f t h e M o T i V d a t a b a s e

    7 ] . T h e c o r p u s c o m p r i s e s 6 0 3 4 u t t e r a n c e s ( 4 4 3 6 f o r t r a i n -

    i n g a n d 1 5 9 8 f o r e v a l u a t i n g t h e e r r o r r a t e ) b y 7 7 0 s p e a k e r s

    i n 1 0 c a r s a t v a r i o u s d r i v i n g s i t u a t i o n s . T r a i n i n g a n d e v a l u -

    a t i o n i s a l w a y s d o n e o n t h e m a t c h e d s c e n a r i o , i . e . t h e s a m e

    n o i s e e l i m i n a t i o n m e t h o d s a r e a p p l i e d d u r i n g t r a i n i n g a n d

    e v a l u a t i o n .

    T h e s p e e c h r e c o g n i z e r i s a c o n t i n u o u s m i x t u r e d e n s i t y

    h i d d e n M a r k o v m o d e l ( H M M ) s y s t e m w h o s e p a r a m e t e r s

    a r e e s t i m a t e d b y V i t e r b i t r a i n i n g . E a c h m i x t u r e c o n s i s t s

    o f 8 G a u s s i a n d e n s i t i e s w i t h d e n s i t y s p e c i c , d i a g o n a l c o -

    v a r i a n c e m a t r i c e s . T h e s y s t e m u s e s t w o H M M s f o r e a c h

    d i g i t , o n e f o r m a l e a n d o n e f o r f e m a l e s p e a k e r s . T h e s i g n a l

    a n a l y s i s i s a s f o l l o w s : T h e o b s e r v e d s p e e c h s i g n a l i s s u b d i -

    v i d e d i n t o o v e r l a p p i n g , 1 6 m s s p a c e d f r a m e s o f 3 2 m s l e n g t h .

    F o r e a c h f r a m e t h e p o w e r s p e c t r u m i s e s t i m a t e d t h r o u g h a

    H a m m i n g w i n d o w e d F F T f o l l o w e d b y a l t e r b a n k w i t h 1 5

    m e l s p a c e d t r i a n g u l a r k e r n e l s . A f t e r a d i s c r e t e c o s i n e t r a n s -

    f o r m o f t h e l o g a r i t h m i c l t e r b a n k o u t p u t s w e o b t a i n 1 2 m e l

    f r e q u e n c y c e p s t r a l c o e c i e n t s , w h i c h , a u g m e n t e d b y 1 2 r e -

    g r e s s i o n c o e c i e n t s , a r e p a s s e d t o t h e r e c o g n i z e r . I n t h i s

    p a p e r w e e x p e r i m e n t w i t h a n a d d i t i o n a l p r e p r o c e s s i n g s t e p

    i n t h e p o w e r s p e c t r a l d o m a i n i n o r d e r t o r e d u c e a d d i t i v e

    n o i s e i n t h e s i g n a l .

    3 . N O T A T I O N A N D A S S U M P T I O N S

    W e a s s u m e t h a t t h e o b s e r v e d n o i s e s i g n a l i s a r e a l i z a t i o n

    o f a w i d e s e n s e s t a t i o n a r y p r o c e s s 1 1 ] . T h e m a j o r p a r t

    o f t h i s p a p e r d e a l s w i t h t h e e s t i m a t i o n o f i t s p o w e r s p e c -

    t r u m N ( ! ) . A s t h e e s t i m a t i o n i s m o r e r e l i a b l e i f m o r e d a t a

    i s a v a i l a b l e , w e u s e t h e n o t a t i o n N ( ! t ) t o d e n o t e a n e s -

    t i m a t i o n o f N ( ! ) u s i n g a l l f r a m e s f r o m t h e b e g i n n i n g o f

    t h e u t t e r a n c e u p t o f r a m e t . F u r t h e r , w e a s s u m e t h a t t h e

    c l e a n s p e e c h s i g n a l w i t h i n e a c h f r a m e t i s a n i n s t a n c e o f a

    w i d e s e n s e s t a t i o n a r y p r o c e s s w i t h p o w e r s p e c t r u m S ( ! t )

    F o r t h e s a k e o f n o t a t i o n a l s i m p l i c i t y w e d o n o t d i s t i n g u i s h

    b e t w e e n p o w e r s p e c t r a a n d p e r i o d i g r a m b a s e d p o w e r s p e c -

    t r u m e s t i m a t i o n s . A s t h e s p e e c h a n d n o i s e s i g n a l a r e a s -

    s u m e d t o b e a d d i t i v e a n d i n d e p e n d e n t , t h e p o w e r s p e c t r u m

    o f t h e o b s e r v e d s i g n a l i s X ( ! t ) = S ( ! t ) + N ( ! ) T h e

    p o w e r s p e c t r u m X ( ! t ) i s e s t i m a t e d b y m a g n i t u d e s q u a r e d

  • 7/26/2019 Quantile Based Noise Estimation for Spectral Subtraction

    2/4

    F o u r i e r c o e c i e n t s o f t h e o b s e r v e d s i g n a l i n f r a m e t . T h e

    c l e a n s p e e c h s i g n a l p o w e r s p e c t r u m c a n t h e r e f o r e b e e s t i -

    m a t e d a s S ( ! t ) = X ( ! t ) ; N ( ! t )

    4 . E S T I M A T I O N O F T H E N O I S E S P E C T R U M

    A c r u c i a l s t e p i n n o i s e s u p p r e s s i o n m e t h o d s l i k e W i e n e r l -

    t e r i n g o r s p e c t r a l s u b t r a c t i o n i s t h e e s t i m a t i o n o f t h e n o i s e

    s p e c t r u m . T h e r e a r e a p p l i c a t i o n s w h e r e t h i s t a s k i s s i m -

    p l i e d b y s o m e p r i o r k n o w l e d g e o f t h e n o i s e s p e c t r u m o r

    b y m u l t i c h a n n e l r e c o r d i n g s . H o w e v e r , i n t h i s p a p e r w e a s -

    s u m e t h a t t h e r e i s o n l y a s i n g l e m i c r o p h o n e a n d a l l w e k n o w

    a b o u t t h e n o i s e s i g n a l i s t h a t i t i s m o r e o r l e s s s t a t i o n a r y ,

    i n d e p e n d e n t o f t h e s p e e c h s i g n a l a n d a d d i t i v e .

    A c o m m o n l y u s e d m e t h o d f o r n o i s e s p e c t r u m e s t i m a -

    t i o n i s t o a v e r a g e o v e r s e c t i o n s i n t h e i n p u t s i g n a l w h i c h d o

    n o t c o n t a i n s p e e c h ( S e c t i o n 4 . 1 ) . H o w e v e r , t h i s a p p r o a c h

    r e q u i r e s t h a t n o n - s p e e c h s e c t i o n s c a n b e d e t e c t e d r e l i a b l y ,

    w h i c h i s d i c u l t e s p e c i a l l y u n d e r n o i s y c o n d i t i o n s . M o r e -

    o v e r , i t r e l i e s o n t h e f a c t t h a t t h e r e a c t u a l l y e x i s t s a s u -

    c i e n t a m o u n t o f n o n - s p e e c h i n t h e s i g n a l . I n o r d e r t o a v o i d

    t h e s e p r o b l e m s , w e p r o p o s e a m e t h o d t o e s t i m a t e t h e n o i s e

    s p e c t r u m w i t h o u t e x p l i c i t f r a m e w i s e s p e e c h / n o n - s p e e c h

    c l a s s i c a t i o n ( S e c t i o n 4 . 2 ) . T h e i d e a i s t o e s t i m a t e t h e n o i s e

    e n e r g y i n e a c h f r e q u e n c y b a n d b y t e m p o r a l q u a n t i l e s i n t h e

    p o w e r s p e c t r a l d o m a i n .

    4 . 1 . N o i s e S p e c t r u m E s t i m a t i o n B a s e d o n F r a m e

    W i s e S p e e c h / N o n - S p e e c h C l a s s i c a t i o n

    I f t h e s i g n a l t o n o i s e r a t i o i s n o t t o o l o w , a s i m p l e m e t h o d

    t o d e t e c t s p e e c h i s b a s e d o n t h e s i g n a l e n e r g y . A s t h e n o i s e

    s i g n a l i s a s s u m e d t o b e s t a t i o n a r y , t h e s i g n a l e n e r g y i n t h e

    e n t i r e u t t e r a n c e i s g r e a t e r o r e q u a l t h e n o i s e e n e r g y . I f

    t h e e n e r g y i n a f r a m e i s s i g n i c a n t l y l a r g e r t h a n t h e e s -

    t i m a t e d n o i s e e n e r g y , t h e n t h e f r a m e i s l i k e l y t o c o n t a i n

    s p e e c h . O t h e r w i s e i t i s a p u r e n o i s e f r a m e a n d i s u s e d t o

    u p d a t e t h e c u r r e n t n o i s e e s t i m a t i o n . L e t X ( ! t ) b e t h e

    p o w e r s p e c t r u m a t f r e q u e n c y ! i n t h e t - t h f r a m e o f t h e

    i n p u t s i g n a l a n d N ( ! t ) b e t h e p o w e r s p e c t r u m o f t h e e s -

    t i m a t e d n o i s e e n e r g y a t f r e q u e n c y ! i n f r a m e t . A s i m p l e

    r e c u r s i v e f o r m u l a t o e s t i m a t e t h e n o i s e e n e r g y N ( ! t ) i s a s

    f o l l o w s :

    N ( ! t ) =

    N ( ! t ; 1 ) i f X N R ( t ) >

    ( 1 ; ) N ( ! t ; 1 ) + X ( ! t ) e l s e

    ( 1 )

    X N R ( t ) =

    P

    !

    X ( ! t )

    P

    !

    N ( ! t ; 1 )

    f o r a l l ! . T h e r e c u r s i o n i s i n i t i a l i z e d b y N ( ! 0 ) = X ( ! 0 ) ,

    w h i c h r e e c t s t h e a s s u m p t i o n t h a t t h e r s t f r a m e o f a n u t -

    t e r a n c e d o e s n o t c o n t a i n s p e e c h . N o t e t h a t e a c h f r a m e i s

    c l a s s i e d a s e i t h e r p u r e n o i s e o r s p e e c h p l u s n o i s e . E q u a -

    t i o n ( 1 ) h a s t w o p a r a m e t e r s a n d w h i c h d e p e n d o n t h e

    s p e e c h d a t a u n d e r c o n s i d e r a t i o n . P a r a m e t e r i s r e l a t e d

    t o t h e s i g n a l t o n o i s e r a t i o . P a r a m e t e r d e t e r m i n e s t h e

    a d a p t a t i o n s p e e d o f t h e n o i s e e s t i m a t i o n . A c c o r d i n g t o e x -

    p e r i m e n t a l r e s u l t s = 1 8 a n d = 0 0 3 p e r f o r m w e l l f o r

    t h e M o T i V c o r p u s . T h e e s t i m a t e d n o i s e N ( ! t ) i s r e m o v e d

    f r o m t h e i n p u t s i g n a l X ( ! t ) b y m e a n s o f a W i e n e r l t e r ,

    s e e S e c t i o n 5 . W i t h t h i s n o i s e e l i m i n a t i o n m e t h o d w e o b -

    t a i n a w o r d e r r o r r a t e o f 1 0 . 3 % . W i t h o u t n o i s e e l i m i n a t i o n

    t h e w o r d e r r o r r a t e i s 1 1 . 7 % , i . e . t h e r e l a t i v e i m p r o v e m e n t

    i s 1 2 % .

    F r a m e w i s e s p e e c h / n o n { s p e e c h c l a s s i c a t i o n u n d e r

    n o i s y c o n d i t i o n s i s a d i c u l t p r o b l e m f a r f r o m b e i n g s o l v e d

    s a t i s f a c t o r i l y . T h e f r a m e e r r o r r a t e o f t h e s p e e c h / n o n -

    s p e e c h c l a s s i e r d e s c r i b e d a b o v e i s a r o u n d 1 6 % o n t h e M o -

    T i V c o r p u s . I n t h e n e x t s e c t i o n w e d e s c r i b e a m e t h o d f o r

    e s t i m a t i n g t h e n o i s e s p e c t r u m w h i c h d o e s n o t r e q u i r e e x -

    p l i c i t s p e e c h / n o n - s p e e c h c l a s s i c a t i o n .

    4 . 2 . Q u a n t i l e B a s e d N o i s e S p e c t r u m E s t i m a t i o n

    I n 1 0 ] a n a l g o r i t h m f o r n o i s e e s t i m a t i o n b a s e d o n m i n i -

    m u m s t a t i s t i c s h a s b e e n p r o p o s e d . A s t h e m i n i m u m i s s e n -

    s i t i v e t o o u t l i e r s w e u s e a q u a n t i l e d i e r e n t f r o m m i n i m u m .

    T h e a l g o r i t h m p r o p o s e d i n t h i s s e c t i o n i s s o m e w h a t s i m p l e r

    a n d h a s f e w e r p a r a m e t e r s t h a n t h e o n e i n 1 0 ] b u t i s c o m -

    p u t a t i o n a l l y m o r e e x p e n s i v e . A s i m i l a r m e t h o d h a s b e e n

    d e s c r i b e d i n 2 ] .

    I t i s w e l l k n o w n t h a t e v e n i n s p e e c h s e c t i o n s o f t h e i n p u t

    s i g n a l n o t a l l f r e q u e n c y b a n d s a r e p e r m a n e n t l y o c c u p i e d

    w i t h s p e e c h . I n f a c t , a s i g n i c a n t p e r c e n t a g e o f t h e t i m e

    t h e e n e r g y i n e a c h f r e q u e n c y b a n d i s o n t h e n o i s e l e v e l .

    T h i s o b s e r v a t i o n c a n b e u s e d t o e s t i m a t e a n o i s e p o w e r

    s p e c t r u m N ( ! ) f r o m t h e o b s e r v e d s p e e c h s i g n a l X ( ! t )

    b y t a k i n g t h e q - t h q u a n t i l e o v e r t i m e i n e v e r y f r e q u e n c y

    b a n d . M o r e p r e c i s e l y , f o r e v e r y ! t h e f r a m e s o f t h e e n -

    t i r e u t t e r a n c e X ( ! t ) , t = 0 : : : T a r e s o r t e d s u c h t h a t

    X ( ! t

    0

    ) X ( ! t

    1

    ) X ( ! t

    T

    ) T h e q - q u a n t i l e n o i s e

    e s t i m a t i o n i s d e n e d a s

    N ( ! ) = X ( ! t

    b q T c

    ) ( 2 )

    F o r e x a m p l e , q = 0 y i e l d s t h e m i n i m u m , q = 1 t h e

    m a x i m u m a n d q = 0 5 t h e m e d i a n . T h i s a p p r o a c h i s b a s e d

    o n t h e a s s u m p t i o n t h a t e a c h f r e q u e n c y b a n d c a r r i e s a t l e a s t

    t h e q - t h f r a c t i o n o f t i m e o n l y n o i s e , e v e n d u r i n g s p e e c h

    s e c t i o n s . O b v i o u s l y t h i s i s t r u e f o r v e r y s m a l l v a l u e s o f

    q b u t i n o r d e r t o o b t a i n a r o b u s t e s t i m a t i o n o f t h e n o i s e

    s p e c t r u m , w h i c h i s n o t s e n s i t i v e t o o u t l i e r s , w e h o p e t h a t q

    i s s o m e w h e r e n e a r t h e m e d i a n , i . e . q 0 5

    300 Hz

    1500 Hz

    3000 Hz

    N()

    q 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9

    F i g u r e 1 : Q u a n t i l e s o f t h e e n e r g y d i s t r i b u t i o n i n t h e o b -

    s e r v e d s i g n a l X a t 3 0 0 H z , 1 5 0 0 H z a n d 3 0 0 0 H z f o r a t y p i c a l

    u t t e r a n c e o f t h e M o T i V c o r p u s .

  • 7/26/2019 Quantile Based Noise Estimation for Spectral Subtraction

    3/4

    F i g u r e 1 s h o w s N ( ! ) a c c o r d i n g t o ( 2 ) i n d e p e n d e n c e o f

    q f o r 3 d i e r e n t f r e q u e n c i e s ! a n d a t y p i c a l 7 d i g i t u t t e r a n c e

    t a k e n f r o m t h e M o T i V c o r p u s . R o u g h l y i n 8 0 - 9 0 % o f t h e

    f r a m e s t h e s i g n a l e n e r g y i n t h e f r e q u e n c y b a n d s i s l o w , i . e .

    c l o s e t o t h e n o i s e e n e r g y l e v e l a n d o n l y i n 1 0 - 2 0 % o f t h e

    t i m e t h e f r e q u e n c y b a n d c a r r i e s h i g h e n e r g y , v o i c e d s p e e c h .

    N o t e t h a t t h e c u r v e s a l s o d e p e n d o n t h e d u r a t i o n o f t h e

    p a u s e s e c t i o n s i n t h e s i g n a l . H o w e v e r , t h e m a j o r p a r t o f

    t h e u t t e r a n c e i n F i g u r e 1 w a s s p e e c h . F o r t h e M o T i V c o r -

    p u s t h e o p t i m a l v a l u e f o r q w a s d e t e r m i n e d e x p e r i m e n t a l l y .

    T h e e s t i m a t e d n o i s e N ( ! ) w a s e l i m i n a t e d f r o m t h e s i g n a l

    b y a W i e n e r l t e r , s e e S e c t i o n 5 . T h e r e s u l t i n g w o r d e r r o r

    r a t e s ( W E R ) a r e s u m m a r i z e d i n T a b l e 1 . T h e w o r d e r r o r

    r a t e w i t h o u t a n y n o i s e r e d u c t i o n m e t h o d i s 1 1 . 7 % , i . e . t h e

    r e l a t i v e r e d u c t i o n i s 2 6 % f o r t h e o p t i m a l c h o i c e q = 0 5 5

    W i t h a 5 9 0 9 w o r d s t e s t s e t w e o b t a i n u n d e r c e r t a i n s i m p l i -

    f y i n g a s s u m p t i o n s a c o n d e n c e i n t e r v a l o f 0 . 8 % o n t h e 9 5 %

    s i g n i c a n c e l e v e l f o r t h e b a s e l i n e e r r o r r a t e 1 1 . 7 % . E r r o r

    r a t e s b e l o w 1 0 . 9 % a r e t h e r e f o r e s i g n i c a n t i m p r o v e m e n t s .

    q 0 . 2 0 . 3 0 . 4 0 . 5 0 . 5 5 0 . 6 0 . 7

    W E R 1 1 . 3 1 0 . 8 1 0 . 1 8 . 9 8 . 6 8 . 8 9 . 7

    T a b l e 1 : W o r d e r r o r r a t e w i t h W i e n e r l t e r a n d n o i s e e s t i -

    m a t i o n N ( ! ) a c c o r d i n g t o ( 2 ) .

    C a u s a l i t y . N o t e t h a t t h e e s t i m a t i o n o f t h e n o i s e s p e c -

    t r u m d e p e n d s o n t h e e n t i r e u t t e r a n c e X ( ! t ) f o r a l l t =

    0 : : : T . A n o i s e s u p p r e s s i o n l t e r b a s e d o n t h i s a p p r o a c h

    i s t h e r e f o r e n o t c a u s a l . H o w e v e r , i f w e d e n e N ( ! t ) a s t h e

    q - q u a n t i l e o f X ( ! ) f o r = 0 : : : t , w e o b t a i n a c a u s a l

    l t e r . T a b l e 2 s u m m a r i z e s t h e r e s u l t s o f t h e s a m e e x p e r i -

    m e n t s a s i n T a b l e 1 b u t t h i s t i m e w e u s e d a c a u s a l n o i s e

    e s t i m a t i o n . T h e e r r o r r a t e s a c h i e v e d b y t h e c a u s a l l t e r

    a r e s l i g h t l y h i g h e r t h a n f o r t h e n o n - c a u s a l c a s e . T h e r e a s o n

    i s t h a t t h e n o i s e e s t i m a t i o n a t t h e b e g i n n i n g o f t h e s i g n a l

    i s v e r y u n r e l i a b l e b e c a u s e f e w d a t a i s a v a i l a b l e t o e s t i m a t e

    N ( ! t ) f o r s m a l l t

    q 0 . 2 0 . 3 0 . 4 0 . 5 0 . 5 5 0 . 6 0 . 7

    W E R 1 1 . 5 1 0 . 8 1 0 . 0 8 . 8 8 . 9 9 . 1 1 0 . 2

    T a b l e 2 : S a m e e x p e r i m e n t a s i n T a b l e 1 b u t w i t h c a u s a l

    n o i s e e s t i m a t i o n .

    E c i e n c y . T h e c o m p u t a t i o n a l c o s t a n d m e m o r y c o n -

    s u m p t i o n f o r e s t i m a t i n g N ( ! t ) g r o w s w i t h t . T h i s i s p r o b -

    l e m a t i c f o r r e a l t i m e a n d l o w r e s o u r c e i m p l e m e n t a t i o n s . A s

    a c o n s e q u e n c e w e i n v e s t i g a t e d a p p r o x i m a t e m e t h o d s f o r t h e

    q u a n t i l e c o m p u t a t i o n w h i c h a r e m o r e e c i e n t i n t e r m s o f

    t i m e a n d s p a c e . T h e i d e a i s t o s t o r e t h e o b s e r v a t i o n s X ( ! t )

    f o r t = 0 1 : : : i n a b u e r w i t h x e d l e n g t h . S e p a r a t e

    b u e r s a r e u s e d f o r e a c h f r e q u e n c y ! . I f a b u e r i s f u l l , t h e n

    t h e l a r g e s t a n d t h e s m a l l e s t e l e m e n t a r e r e m o v e d f r o m t h e

    b u e r . T h e q u a n t i l e i s d e t e r m i n e d b y c o n s i d e r i n g o n l y t h e

    e l e m e n t s i n t h e b u e r . T h e o b v i o u s q u e s t i o n n o w i s h o w

    l a r g e t h e b u e r s h o u l d b e a n d h o w m u c h t h e r e c o g n i t i o n

    e r r o r r a t e i n c r e a s e s w i t h a n i t e l e n g t h b u e r . R e s u l t s o f

    e x p e r i m e n t s w i t h d i e r e n t b u e r l e n g t h s a n d q = 0 5 a r e

    r e p o r t e d i n T a b l e 3 . A s e x p e c t e d , t h e e r r o r r a t e i n c r e a s e s

    f o r s m a l l b u e r s i z e s a n d a c h i e v e s a s y m p t o t i c a l l y t h e e r r o r

    r a t e o f t h e e x a c t q u a n t i l e c o m p u t a t i o n . A n o t h e r m e t h o d t o

    3 5 1 0 2 0 4 0 6 0 1 0 0

    W E R 1 0 . 6 1 0 . 2 9 . 3 9 . 1 9 . 3 9 . 2 8 . 9

    T a b l e 3 : S a m e e x p e r i m e n t a s i n T a b l e 2 f o r q = 0 5 b u t

    w i t h l i m i t e d b u e r l e n g t h f o r t h e q u a n t i l e c o m p u t a t i o n .

    i m p r o v e e c i e n c y i s t o i n t e g r a t e s e v e r a l a d j a c e n t f r e q u e n -

    c i e s a n d d o a b a n d w i s e n o i s e e s t i m a t i o n 6 ] .

    N o n - s t a t i o n a r y N o i s e . W e o b s e r v e d t h a t t h e c l a s s i -

    e r b a s e d m e t h o d i n S e c t i o n 4 . 1 p e r f o r m s q u i t e p o o r l y i f

    t h e n o i s e e n e r g y i n c r e a s e s a b r u p t l y , s a y a t t i m e

    t . T h e r e a -

    s o n i s t h a t t h e e s t i m a t e d n o i s e N ( !

    t ) a t t i m e

    t i s s m a l l

    c o m p a r e d t o s u b s e q u e n t i n p u t f r a m e s X ( ! t ) f o r t >

    t ,

    e s p e c i a l l y i f f r a m e X ( ! t ) d o e s n o t c o n t a i n s p e e c h . T h e r e -

    f o r e , a c c o r d i n g t o ( 1 ) , a l l f r a m e s a f t e r

    t a r e c l a s s i e d a s

    s p e e c h a n d h e n c e t h e n o i s e e s t i m a t i o n w i l l n o t b e u p d a t e d

    a n y m o r e a f t e r t i m e

    t , i . e . N ( ! t ) = N ( !

    t ) f o r a l l t >

    t

    I n o t h e r w o r d s , t h e n o i s e e s t i m a t i o n d o e s n o t c o n v e r g e t o

    t h e o b s e r v e d n o i s e . T h e q u a n t i l e b a s e d m e t h o d p r e s e n t e d

    i n t h i s s e c t i o n d o e s n o t s u e r f r o m t h i s p r o b l e m a n d s e e m s

    t h e r e f o r e a d v a n t a g e o u s f o r n o n - s t a t i o n a r y n o i s e . I n o r d e r

    t o v e r i f y t h i s t h e o r e t i c a l c o n s i d e r a t i o n b y a n e x p e r i m e n t ,

    w e i n s e r t e d 0 . 5 s e c o n d s o f c a r n o i s e f r o m a B M W 5 4 0 a t 5 0

    k m / h b e f o r e t h e b e g i n n i n g o f e a c h s o u n d l e o f t h e t e s t s e t .

    T h e c o l u m n s o f T a b l e 4 c o n t a i n t h e w o r d e r r o r r a t e s f o r t h e

    c a s e s n o n o i s e r e d u c t i o n , n o i s e e s t i m a t i o n b y t h e c l a s s i e r

    b a s e d m e t h o d a n d n o i s e e s t i m a t i o n b y t h e q u a n t i l e b a s e d

    m e t h o d f o r q = 0 5 a n d b u e r s i z e s 1 0 , 2 0 , 6 0 , a n d u n l i m i t e d

    r e s p e c t i v e l y . I n e a c h s c e n a r i o t h e e r r o r r a t e i s s i g n i c a n t l y

    h i g h e r t h a n i n t h e c o r r e s p o n d i n g c a s e w i t h o u t i n s e r t e d c a r

    n o i s e . T h e d e t e r i o r a t i o n f o r t h e c l a s s i e r b a s e d n o i s e e s -

    t i m a t i o n m e t h o d , h o w e v e r , i s m u c h m o r e s e v e r e t h a n f o r

    t h e q u a n t i l e b a s e d m e t h o d a n d i s e v e n w o r s e t h a n f o r t h e

    c a s e w i t h o u t n o i s e e l i m i n a t i o n . T h e a d a p t a t i o n t i m e t o a

    c h a n g i n g n o i s e s i g n a l i n t h e q u a n t i l e b a s e d m e t h o d i s p r o -

    p o r t i o n a l t o t h e b u e r l e n g t h , w h i c h e x p l a i n s w h y i n t h i s

    e x p e r i m e n t s h o r t e r b u e r l e n g t h s g i v e b e t t e r r e s u l t s .

    M e t h o d n o n e c l a s s i e r q u a n t i l e = 1 0 2 0 6 0 1

    W E R 1 3 . 7 1 8 . 5 1 0 . 1 1 0 . 5 1 0 . 6 1 1 . 7

    T a b l e 4 : W o r d e r r o r r a t e i f 0 . 5 s e c o n d s l o w e n e r g y c a r n o i s e

    a r e a d d e d t o t h e b e g i n n i n g o f t h e s o u n d l e s o f t h e t e s t s e t .

    5 . E L I M I N A T I O N O F T H E N O I S E F R O M T H E

    S P E E C H S I G N A L

    I n t h e p r e v i o u s s e c t i o n w e d i s c u s s e d m e t h o d s f o r e s t i m a t -

    i n g t h e n o i s e p o w e r s p e c t r u m N ( ! t ) . I n t h i s s e c t i o n w e

    r e v i e w a p p r o a c h e s f o r e l i m i n a t i n g t h e e s t i m a t e d n o i s e f r o m

    t h e o b s e r v e d s i g n a l . I f w e h a d c o m p l e t e i n f o r m a t i o n a b o u t

    t h e n o i s e s p e c t r u m , i . e . m a g n i t u d e a n d p h a s e , t h e n o i s e

    e l i m i n a t i o n w o u l d a m o u n t t o a s i m p l e s u b t r a c t i o n o f t h e

    c o m p l e x F o u r i e r c o e c i e n t s . U n f o r t u n a t e l y w e h a v e n o

    p h a s e i n f o r m a t i o n o f t h e n o i s e . H e n c e w e a p p l y s p e c t r a l

    s u b t r a c t i o n a n d W i e n e r l t e r i n g f o r t h e n o i s e e l i m i n a t i o n .

    T h e F I R W i e n e r l t e r i s d e n e d a s t h e l i n e a r l t e r w h i c h

    m i n i m i z e s t h e m e a n s q u a r e e r r o r i n t h e t i m e d o m a i n . S p e c -

    t r a l s u b t r a c t i o n r e l i e s o n t h e f a c t t h a t t h e p o w e r s p e c t r u m

    o f t h e s u m o f t w o i n d e p e n d e n t r a n d o m s i g n a l s i s t h e s u m

    o f t h e p o w e r s p e c t r a . T h e n o i s e e l i m i n a t i o n r u l e o f s p e c t r a l

  • 7/26/2019 Quantile Based Noise Estimation for Spectral Subtraction

    4/4

    s u b t r a c t i o n i s t h e r e f o r e s i m p l y t o s u b t r a c t t h e p o w e r s p e c -

    t r u m o f t h e e s t i m a t e d n o i s e f r o m t h e p o w e r s p e c t r u m o f t h e

    o b s e r v e d s i g n a l . S u r p r i s i n g l y t h e f o r m u l a e f o r t h e W i e n e r

    l t e r a n d s p e c t r a l s u b t r a c t i o n a r e q u i t e s i m i l a r . L e t

    H ( ! t ) = ( X ( ! t ) ; N ( ! t ) ) = X ( ! t ) ( 3 )

    T h e n o i s e r e d u c e d s i g n a l S ( ! t ) b y W i e n e r l t e r i n g i s

    S ( ! t ) = H ( ! t )

    2

    X ( ! t )

    n o i s e r e d u c t i o n b y s p e c t r a l s u b t r a c t i o n i s d e n e d a s

    S ( ! t ) = X ( ! t ) ; N ( ! t ) = H ( ! t ) X ( ! t )

    S o m e t i m e s t h e l o n g t e r m e s t i m a t e d n o i s e p o w e r s p e c t r u m

    N ( ! t ) c a n b e l a r g e r t h a n t h e i n s t a n t a n e o u s o b s e r v e d p o w e r

    s p e c t r u m X ( ! t ) . I n t h i s c a s e w e w o u l d e x p e c t t h a t t h e

    n o i s e r e d u c e d p o w e r s p e c t r u m S ( ! t ) s h o u l d b e z e r o . T h e r e -

    f o r e ( 3 ) i s u s u a l l y m o d i e d a s

    H ( ! t ) = m a x ( X ( ! t ) ; N ( ! t ) 0 ) = X ( ! t )

    E x p e r i m e n t a l e x p e r i e n c e i n d i c a t e s t h a t b e t t e r r e c o g n i t i o n

    r e s u l t s a r e a c h i e v e d i f a s m a l l f r a c t i o n o f t h e n o i s e p o w e r

    i s l e f t i n t h e s i g n a l 1 , 1 0 ] . H e n c e , t h e e n e r g y o f t h e n o i s e

    r e d u c e d s i g n a l S ( ! t ) w h i c h i s p a s s e d t o t h e r e c o g n i z e r i s

    S

    ( ! t ) = m a x ( S ( ! t ) N ( ! t ) )

    w h e r e = 0 0 4 h a s b e e n c h o s e n e x p e r i m e n t a l l y .

    A n e x p e r i m e n t a l c o m p a r i s o n o f s p e c t r a l s u b t r a c t i o n a n d

    W i e n e r l t e r i n g f o r = 0 0 4 i s g i v e n i n T a b l e 5 . T h e n o i s e

    p o w e r s p e c t r u m N ( ! t ) h a s b e e n e s t i m a t e d a s i n T a b l e 2 .

    q 0 . 2 0 . 3 0 . 4 0 . 5 0 . 6 0 . 7 0 . 8

    W i e n e r 1 1 . 5 1 0 . 8 1 0 . 0 8 . 8 9 . 1 1 0 . 2 1 2 . 1

    S u b t r . 1 1 . 7 1 1 . 4 1 0 . 9 1 0 . 1 9 . 9 9 . 6 1 1 . 6

    T a b l e 5 : E x p e r i m e n t a l c o m p a r i s o n o f t h e w o r d e r r o r r a t e s

    o f W i e n e r l t e r i n g a n d s p e c t r a l s u b t r a c t i o n .

    A s s u g g e s t e d i n 1 ] t h e p e r f o r m a n c e o f s p e c t r a l s u b t r a c -

    t i o n c a n b e i m p r o v e d b y s u b t r a c t i n g a n o v e r e s t i m a t i o n o f

    t h e n o i s e p o w e r s p e c t r u m , i . e .

    S

    ( ! t ) = m a x ( X ( ! t ) ; N ( ! t ) N ( ! t ) )

    I n o u r e x p e r i m e n t s w e f o u n d a n o p t i m u m f o r = 2 5 , w h i c h

    g i v e s a w o r d e r r o r r a t e o f 9 . 2 % f o r q = 0 5

    6 . C O N C L U S I O N

    W e i n v e s t i g a t e d m e t h o d s t o r e m o v e a d d i t i v e n o i s e f r o m a

    s p e e c h s i g n a l w h i c h h a s b e e n r e c o r d e d i n t h e c a r e n v i r o n -

    m e n t b y a s i n g l e m i c r o p h o n e . T h e e r r o r r a t e o f a s p e e c h

    r e c o g n i z e r h a s b e e n r e d u c e d b y u p t o 2 6 % r e l a t i v e b y q u a n -

    t i l e b a s e d n o i s e e s t i m a t i o n i n t h e p o w e r s p e c t r a l d o m a i n

    a n d W i e n e r l t e r i n g . T h e m e t h o d s p r o c e e d i n t w o s t e p s :

    E s t i m a t i o n o f t h e n o i s e s i g n a l a n d e l i m i n a t i o n .

    N o i s e E s t i m a t i o n . W e s t u d i e d t w o n o i s e e s t i m a t i o n

    m e t h o d s : T h e r s t o n e i s b a s e d o n f r a m e w i s e s p e e c h / n o n -

    s p e e c h c l a s s i c a t i o n a n d r e c u r s i v e s m o o t h i n g o v e r n o n - s p e e c h

    f r a m e s ( S e c t i o n 4 . 1 ) , t h e s e c o n d m e t h o d e s t i m a t e s t h e n o i s e

    b y q u a n t i l e s i n t h e p o w e r s p e c t r a l d o m a i n ( S e c t i o n 4 . 2 ) .

    T h e q u a n t i l e b a s e d n o i s e e s t i m a t i o n m e t h o d g i v e s s i g n i -

    c a n t l y b e t t e r r e s u l t s b u t i s m o r e e x p e n s i v e i n t e r m s o f c o m -

    p u t i n g t i m e a n d m e m o r y . A n a p p r o x i m a t i o n a l g o r i t h m f o r

    i m p r o v i n g t h e e c i e n c y o f t h e q u a n t i l e b a s e d m e t h o d h a s

    b e e n p r o p o s e d . T h e c l a s s i e r b a s e d m e t h o d r e q u i r e s p r i o r

    k n o w l e d g e a b o u t t h e s i g n a l t o n o i s e r a t i o , w h i c h i s n o t t h e

    c a s e f o r t h e q u a n t i l e b a s e d m e t h o d . H o w e v e r , t h e q u a n -

    t i l e b a s e d m e t h o d r e l i e s o n a s s u m p t i o n s o n e n e r g y d i s t r i b u -

    t i o n s o f h u m a n s p e e c h i n t h e t i m e { f r e q u e n c y d o m a i n , w h i c h

    n e e d t o b e v e r i e d b y m o r e e x p e r i m e n t s . F i n a l l y , t h e q u a n -

    t i l e b a s e d m e t h o d s e e m s t o w o r k b e t t e r f o r c e r t a i n k i n d s o f

    n o n - s t a t i o n a r y n o i s e t h a n t h e c l a s s i e r b a s e d m e t h o d .

    N o i s e E l i m i n a t i o n . T w o m e t h o d s f o r r e m o v i n g t h e

    e s t i m a t e d n o i s e h a v e b e e n i n v e s t i g a t e d , n a m e l y s p e c t r a l

    s u b t r a c t i o n a n d W i e n e r l t e r i n g . T h e l a t t e r s e e m s s u p e r i o r

    a c c o r d i n g t o e x p e r i m e n t a l e v i d e n c e ( S e c t i o n 5 ) . I f s p e c t r a l

    s u b t r a c t i o n i s m o d i e d s u c h t h a t a n a p p r o p r i a t e o v e r e s t i -

    m a t i o n o f t h e n o i s e i s s u b t r a c t e d , t h e n t h e a c h i e v e d e r r o r

    r a t e c o m e s c l o s e t o t h e W i e n e r l t e r .

    7 . R E F E R E N C E S

    1 ] M . B e r o u t i , R . S c h w a r t z , a n d J . M a k h o u l , \ E n h a n c e -

    m e n t o f S p e e c h C o r r u p t e d b y A c o u s t i c N o i s e , " i n P r o c .

    I C A S S P , ( W a s h i n g t o n , U S A ) , p p . 2 0 8 { 2 1 1 , A p r . 1 9 7 9 .

    2 ] H . G . H i r s c h a n d C . E h r l i c h e r , \ N o i s e E s t i m a t i o n

    T e c h n i q u e s f o r R o b u s t S p e e c h R e c o g n i t i o n , " i n P r o c .

    I C A S S P , p p . 1 5 3 { 1 5 7 , 1 9 9 5 .

    3 ] J u a n g , B . H . \ S p e e c h R e c o g n i t i o n i n A d v e r s e E n v i r o n -

    m e n t s " , C o m p u t e r S p e e c h a n d L a n g u a g e 5 : p p . 2 7 5 -

    2 9 4 , 1 9 9 1 .

    4 ] J u n q u a , J . - C . , H a t o n , J . P . \ R o b u s t n e s s i n A u t o m a t i c

    S p e e c h R e c o g n i t i o n : F u n d a m e n t a l s a n d A p p l i c a t i o n s " ,

    K l u w e r , B o s t o n , 1 9 9 6 .

    5 ] P . L o c k w o o d a n d J . B o u d y , \ E x p e r i m e n t s w i t h a

    N o n l i n e a r S p e c t r a l S u b t r a c t o r ( N S S ) , H i d d e n M a r k o v

    M o d e l s a n d t h e p r o j e c t i o n , f o r r o b u s t s p e e c h r e c o g n i -

    t i o n i n c a r s , " S p e e c h C o m m u n i c a t i o n , v o l . 1 1 , p p . 2 1 5 {

    2 2 8 , 1 9 9 2 .

    6 ] L . S i n g h a n d S . S r i d h a r a n , \ S p e e c h E n h a n c e m e n t u s -

    i n g C r i t i c a l B a n d S p e c t r a l S u b t r a c t i o n , " i n P r o c . I C -

    S L P , ( S y d n e y , A u s t r a l i a ) , N o v . 1 9 9 8 .

    7 ] D . L a n g m a n n , T . S c h n e i d e r , R . G r u d s z u s , A . F i s c h e r ,

    T . C r u l l , H . P t z i n g e r , M . W e s t p h a l , a n d U . J e k o s c h ,

    \ C S D C - T h e M o T i V C a r - S p e e c h D a t a C o l l e c t i o n , " i n

    F i r s t I n t e r n a t i o n a l C o n f e r e n c e o n L a n g u a g e R e s o u r c e s

    a n d E v a l u a t i o n , ( G r a n a d a , S p a i n ) , M a y 1 9 9 8 .

    8 ] A . F i s c h e r a n d V . S t a h l , \ S u b w o r d U n i t b a s e d S p e e c h

    R e c o g n i t i o n i n C a r E n v i r o n m e n t s , " i n P r o c . I C A S S P ,

    ( S e a t t l e , U S A ) , p p . 2 5 7 { 2 6 1 , M a y 1 9 9 8

    9 ] A . F i s c h e r a n d V . S t a h l , \ D a t a b a s e a n d O n l i n e A d a p t a -

    t i o n f o r i m p r o v e d S p e e c h R e c o g n i t i o n i n C a r E n v i r o n -

    m e n t s , " i n P r o c . I C A S S P , ( P h o e n i x , U S A ) , p p . 4 4 5 {

    4 4 9 , M a r c h 1 9 9 9

    1 0 ] R . M a r t i n , \ S p e c t r a l S u b t r a c t i o n b a s e d o n M i n i m u m

    S t a t i s t i c s , " P r o c . E u r o p e a n S i g n a l P r o c e s s i n g C o n f e r -

    e n c e , p p . 1 1 8 2 { 1 1 8 5 , S e p 1 9 9 4 .

    1 1 ] M . H . H a y e s , \ S t a t i s t i c a l D i g i t a l S i g n a l P r o c e s s i n g a n d

    M o d e l i n g , " J o h n W i l e y & S o n s , I n c . , 1 9 9 6 .