結合 gmm 與 k-means 之語者分群 方法
DESCRIPTION
結合 GMM 與 K-means 之語者分群 方法. 古鴻炎 游政人 國立台灣科技大學資訊工程系 第十三屆人工智慧與應用研討會 TAAI2008. Presenter Chia-Cheng Chen. 大綱. 介紹 方法 實驗 結果 結論. 介紹. 提出一種結合 GMM 和 K-means 分群之 語者 分群方法 。 先為各個語者建立一個 GMM 模型,然後採取基於散異度 (divergence) 的距離函數來量測兩 GMM 模型之間的距離,接著使用我們修正的 K-means 分群演算法來進行語者的分群。. 方法. 方法 (Cont.). - PowerPoint PPT PresentationTRANSCRIPT
![Page 1: 結合 GMM 與 K-means 之語者分群 方法](https://reader030.vdocuments.site/reader030/viewer/2022013103/56813ddf550346895da7adf0/html5/thumbnails/1.jpg)
結合 GMM 與 K-means 之語者分群方法
古鴻炎 游政人國立台灣科技大學資訊工程系
第十三屆人工智慧與應用研討會 TAAI2008
Presenter Chia-Cheng Chen
![Page 2: 結合 GMM 與 K-means 之語者分群 方法](https://reader030.vdocuments.site/reader030/viewer/2022013103/56813ddf550346895da7adf0/html5/thumbnails/2.jpg)
介紹
方法
實驗結果
結論
大綱
![Page 3: 結合 GMM 與 K-means 之語者分群 方法](https://reader030.vdocuments.site/reader030/viewer/2022013103/56813ddf550346895da7adf0/html5/thumbnails/3.jpg)
提出一種結合 GMM 和 K-means 分群之語者分群方法。
先為各個語者建立一個 GMM 模型,然後採取基於散異度 (divergence) 的距離函數來量測兩 GMM 模型之間的距離,接著使用我們修正的 K-means 分群演算法來進行語者的分群。
介紹
![Page 4: 結合 GMM 與 K-means 之語者分群 方法](https://reader030.vdocuments.site/reader030/viewer/2022013103/56813ddf550346895da7adf0/html5/thumbnails/4.jpg)
方法
![Page 5: 結合 GMM 與 K-means 之語者分群 方法](https://reader030.vdocuments.site/reader030/viewer/2022013103/56813ddf550346895da7adf0/html5/thumbnails/5.jpg)
GMM 模型建造
距離量測與模型距離
修正之 K-means 分群法
方法 (Cont.)
![Page 6: 結合 GMM 與 K-means 之語者分群 方法](https://reader030.vdocuments.site/reader030/viewer/2022013103/56813ddf550346895da7adf0/html5/thumbnails/6.jpg)
GMM 模型建造
方法 (Cont.)
M
iii xbwxp
1
)()|(
SkkXpS
1
)|(maxargˆ
![Page 7: 結合 GMM 與 K-means 之語者分群 方法](https://reader030.vdocuments.site/reader030/viewer/2022013103/56813ddf550346895da7adf0/html5/thumbnails/7.jpg)
距離量測與模型距離◦Mahalanobis 距離
◦Bhattacharyya 距離
方法 (Cont.)
![Page 8: 結合 GMM 與 K-means 之語者分群 方法](https://reader030.vdocuments.site/reader030/viewer/2022013103/56813ddf550346895da7adf0/html5/thumbnails/8.jpg)
基於 Pseudo Divergence 的模型距離
方法 (Cont.)
![Page 9: 結合 GMM 與 K-means 之語者分群 方法](https://reader030.vdocuments.site/reader030/viewer/2022013103/56813ddf550346895da7adf0/html5/thumbnails/9.jpg)
K-means 演算法1. 先從 N 個向量中隨機挑選出 K 個當作初始的中心向量
2. 訓練向量 Xn ,計算它離每個中心向量 Ck 的距離
3. grp(Xn)=arg min distance(Xn, Ck)
4. 計算各群的新中心向量
5. 設前一次疊代的失真距離為 R’ ,而本次疊代後的失真距離為 。 R / R’ , > Thr(0.98)
方法 (Cont.)
![Page 10: 結合 GMM 與 K-means 之語者分群 方法](https://reader030.vdocuments.site/reader030/viewer/2022013103/56813ddf550346895da7adf0/html5/thumbnails/10.jpg)
計算各群的成員對於該群當中其它成員的幾何平均距離
方法 (Cont.)
![Page 11: 結合 GMM 與 K-means 之語者分群 方法](https://reader030.vdocuments.site/reader030/viewer/2022013103/56813ddf550346895da7adf0/html5/thumbnails/11.jpg)
實驗結果 TCC-300 語料庫中的 303 位語者 (151 位男性 , 152
位女性 )
額外 30 位語者 ( 男女性各 15 人 )◦前進、後退左轉、右轉、開始、停止、準備、機器人、向
後轉、煞車。
![Page 12: 結合 GMM 與 K-means 之語者分群 方法](https://reader030.vdocuments.site/reader030/viewer/2022013103/56813ddf550346895da7adf0/html5/thumbnails/12.jpg)
實驗結果 (Cont.)
![Page 13: 結合 GMM 與 K-means 之語者分群 方法](https://reader030.vdocuments.site/reader030/viewer/2022013103/56813ddf550346895da7adf0/html5/thumbnails/13.jpg)
評估方法
實驗結果 (Cont.)
K:群落數N:總資料點數nk:群落 k中資料點數Zk:所有資料點的中心點
![Page 14: 結合 GMM 與 K-means 之語者分群 方法](https://reader030.vdocuments.site/reader030/viewer/2022013103/56813ddf550346895da7adf0/html5/thumbnails/14.jpg)
實驗結果 (Cont.)
![Page 15: 結合 GMM 與 K-means 之語者分群 方法](https://reader030.vdocuments.site/reader030/viewer/2022013103/56813ddf550346895da7adf0/html5/thumbnails/15.jpg)
本文研究語者分群的目的是,希望使用少量語者的錄音語料,便能夠建立強健的 HMM 模型,來作為語音命令辨識之用。
303 個語者作 40 群的分群,然後只把 40 群中心語者的語料拿去訓練 HMM 辨識模型,就可使語音命令的辨識率達到飽和,亦即辨識率和 303 個語者都拿去訓練 HMM 的辨識率相當。
CH 分群評估值和辨識率之間的相關性,並未發現兩者之間有相關性存在。
結論