會員中心 |  會員注冊  |  兼職信息發(fā)布    瀏覽手機(jī)版!    精選9.9元!    人工翻譯    英語IT服務(wù) 貧困兒童資助 | 留言板 | 設(shè)為首頁 | 加入收藏  繁體中文
當(dāng)前位置:首頁 > 機(jī)翻技術(shù) > 識別技術(shù) > 正文

Viterbi算法在語音識別中的應(yīng)用

發(fā)布時間: 2022-07-07 09:29:49   作者:etogether.net   來源: 網(wǎng)絡(luò)   瀏覽次數(shù):


1. 從前一單元開始的前面路徑的概率forward [t-1, i] ;

2. 從前一狀態(tài)i到當(dāng)前狀態(tài)i的轉(zhuǎn)移概率a ij

3. 當(dāng)前狀態(tài)j與觀察符號t匹配的觀察似然度b jt。對于在這里考慮的加權(quán)自動機(jī)來說,如果觀察符號與狀態(tài)相匹配,則b jt為1,否則為0。


2.png


圖2 在連續(xù)語音識別中發(fā)現(xiàn)最優(yōu)狀態(tài)序列的Viterbi算法,為簡單起見,使用音子作為輸入。給出音子的觀察序列和加權(quán)自動機(jī)(狀態(tài)圖),算法返回具有最大概率的自動機(jī)的路徑,并且接收觀察序列。a[S,S']表示從當(dāng)前狀態(tài)s到下一個狀態(tài)s'的轉(zhuǎn)移概率,b[S',Ot]表示對于給定的Ot,s'的觀察似然度。對于這里考慮的加權(quán)自動機(jī),如果觀察符號與狀態(tài)匹配,b[S', Ot]為1,否則為0



在圖3 中,在輸入n這一列,每個單詞都以[n]開頭,因此在狀態(tài)為n的單元內(nèi),每個單元都具有非零概率。在這一列中的其他單元的項目為零,因為它們的狀態(tài)與n不匹配。當(dāng)我們向前進(jìn)入下一列時,每個與iy匹配的單元的值等于前一個單元的內(nèi)容乘以從前一單元到這一單元的轉(zhuǎn)移概率。這樣,單詞new的狀態(tài)iy的viterbi [2, iynew]值等于new的“單詞概率”乘以new在這個位置的發(fā)音為元音iy的概率。注意,如果只是看iy這一列,單詞need就是當(dāng)前具有“最大概率”的單詞。但是,如果繼續(xù)向前移動,進(jìn)入最后一列,取得最后勝利的將是單詞new,因為need進(jìn)入end的轉(zhuǎn)移概率最小(等于0.11),而new進(jìn)入end的轉(zhuǎn)移概率為1.0?,F(xiàn)在我們可以跟隨返回指針,回溯并找到最后概率為0.00036的路徑,從而判斷單詞new取得最后勝利。


3.png


圖3 Viterbi算法在單獨(dú)的狀態(tài)列中的各個項目。每個單元保持了在當(dāng)前情況下的最好路徑的概率以及沿著這條路徑指向前一個單元的指針。從最后狀態(tài)end回溯,可以重建達(dá)到最好的單詞new的狀態(tài)序列nnew iynew



責(zé)任編輯:admin



微信公眾號

[上一頁][1] [2] 【歡迎大家踴躍評論】
我來說兩句
評分: 1分 2分 3分 4分 5分
評論內(nèi)容:
驗證碼:
【網(wǎng)友評論僅供其表達(dá)個人看法,并不表明本站同意其觀點(diǎn)或證實(shí)其描述?!?
評論列表
已有 0 條評論(查看更多評論)