會員中心 |  會員注冊  |  兼職信息發(fā)布    瀏覽手機(jī)版!    精選9.9元!    人工翻譯    英語IT服務(wù) 貧困兒童資助 | 留言板 | 設(shè)為首頁 | 加入收藏  繁體中文
當(dāng)前位置:首頁 > 機(jī)翻技術(shù) > 識別技術(shù) > 正文

語音和語言處理中的加權(quán)自動(dòng)機(jī)

發(fā)布時(shí)間: 2022-07-05 09:18:39   作者:etogether.net   來源: 網(wǎng)絡(luò)   瀏覽次數(shù):
摘要: 加權(quán)自動(dòng)機(jī)是由有限自動(dòng)機(jī)擴(kuò)充而成的,在加權(quán)自動(dòng)機(jī)的每個(gè)弧上標(biāo)有概率,表示下一步走哪一條途徑的可能性。


為了提高效率,通常把編輯好的各種發(fā)音變異存儲在詞表中。這種詞表的兩種最普通的表示是trie 和加權(quán)有限狀態(tài)自動(dòng)機(jī)/轉(zhuǎn)錄機(jī)或概率FSA/FST(Pereira et al.,1994)。加權(quán)自動(dòng)機(jī)是由有限自動(dòng)機(jī)擴(kuò)充而成的,在加權(quán)自動(dòng)機(jī)的每個(gè)弧上標(biāo)有概率,表示下一步走哪一條途徑的可能性。離開同一個(gè)結(jié)點(diǎn)的所有弧上的概率之和應(yīng)該為1。圖5.12是關(guān)于單詞tomato的兩個(gè)加權(quán)自動(dòng)機(jī),取自Russell and Norvig(1995)。上面的自動(dòng)機(jī)表示在不同的方言中tomato一詞的第二個(gè)元音的兩種不同發(fā)音。下面一個(gè)自動(dòng)機(jī)說明了更多的發(fā)音情況(請讀者算一下有多少個(gè)不同的情況?),表示tomato中的第一個(gè)元音的可能的弱化和脫落,以及詞末[t]的可能的閃音化。


1.png

圖1


圖1  你說[t ow m ey t ow],我說[t ow m aa t ow]。單詞tomato的兩個(gè)發(fā)音網(wǎng)絡(luò),取自Russell and Norvig(1995)。上面一個(gè)自動(dòng)機(jī)模擬社會語言變異(在某些英國英語或美國英語東部方言中);下面一個(gè)自動(dòng)機(jī)加上了協(xié)同發(fā)音效應(yīng)。注意音位變異和社會語言變異之間的關(guān)聯(lián)作用;在具有元音[ey]的方言中,閃音化的可能性比其他方言大


馬爾可夫鏈?zhǔn)羌訖?quán)自動(dòng)機(jī)的一種特殊情況,在馬爾可夫鏈中,輸入符號序列惟一地確定了自動(dòng)機(jī)將通過的狀態(tài)。由于這些狀態(tài)不能表示符號序列內(nèi)在的歧義問題,只有當(dāng)概率值賦予無歧義的序列時(shí),馬爾可夫鏈才是有用的。且N元語法模型都是馬爾可夫鏈,因?yàn)樵谔幚砻總€(gè)單詞時(shí)都將其看成是沒有歧義的。實(shí)際上,在語音和語言處理中使用的加權(quán)自動(dòng)機(jī)等價(jià)于隱馬爾可夫模型(Hidden Markov Models,簡稱HMM)。而加權(quán)自動(dòng)機(jī)和HMM兩個(gè)模型提供了不同的比喻;把某些問題想像成加權(quán)自動(dòng)機(jī)比想像成HMM更容易理解一些。加權(quán)自動(dòng)機(jī)的比喻通常用于輸入字母表比較清晰地映射于底層字母表的場合。例如,在打字輸入的錯(cuò)拼更正問題中,包含字母和自動(dòng)機(jī)狀態(tài)的輸入序列可以對應(yīng)于字母。因此,就可以很自然地把這個(gè)問題想像成從一個(gè)符號集合轉(zhuǎn)錄為同一個(gè)符號集合的問題,只是做了某些修改而已;正因?yàn)檫@樣,使用加權(quán)自動(dòng)機(jī)來進(jìn)行錯(cuò)拼更正就是非常自然的了。在手寫輸入錯(cuò)拼更正的問題中,輸入序列是可以看見的,輸入字母表是由直線、角和曲線構(gòu)成的字母表。這里,我們不是把一個(gè)字母表轉(zhuǎn)錄成它自己,在把某個(gè)輸入序列考慮為狀態(tài)序列之前,應(yīng)該把這個(gè)輸入序列加以分類。隱馬爾可夫模型(HMM)提供了一個(gè)更恰當(dāng)?shù)谋扔鳎驗(yàn)镠MM對于輸人序列和狀態(tài)序列很自然地分別使用不同的字母表來處理。但是,因?yàn)槿魏我粋€(gè)概率自動(dòng)機(jī),只要其中的輸入序列不是惟一地指定其狀態(tài)序列,它就可以被模擬為一個(gè)HMM,其差別只是比喻上的差別,而不是解釋能力上的差別。


加權(quán)自動(dòng)機(jī)可以使用很多方法來構(gòu)造。Cohen (1989)首先提出的一種方法是:從聯(lián)機(jī)的發(fā)音詞典開始,使用前面介紹過的手寫規(guī)則構(gòu)造不同的潛在表層形式。通過計(jì)算在語料庫中每個(gè)發(fā)音的出現(xiàn)次數(shù)可以得到概率。如果語料庫的數(shù)據(jù)太稀疏,也可以通過學(xué)習(xí)每個(gè)規(guī)則的概率,并且對于每個(gè)表層形式把這些規(guī)則概率相乘而得到概率(Tajchman et al.,1995)。最后,這些加權(quán)的規(guī)則或與決策樹,都可以自動(dòng)地編到加權(quán)有限狀態(tài)轉(zhuǎn)錄機(jī)中(Sproat and Riley,1996)。另外,對于每個(gè)常用詞,我們可以簡單地從標(biāo)音語料庫中發(fā)現(xiàn)足夠的發(fā)音實(shí)例,只要把這些發(fā)音實(shí)例結(jié)合起來加到一個(gè)網(wǎng)絡(luò)中,就可以構(gòu)造出模型(Wooters and Stolcke,1994)。


上面關(guān)于tomato的那個(gè)網(wǎng)絡(luò)只是為了舉例說明,不是從任何實(shí)際系統(tǒng)中來的。圖5.13是從Switchboard語料庫中根據(jù)對實(shí)際發(fā)音的訓(xùn)練而得到的關(guān)于單詞about 的加權(quán)自動(dòng)機(jī)。

2.png

圖2 


圖2  從Switchboard語料庫的實(shí)際發(fā)音中訓(xùn)練得到的關(guān)于單詞about 的發(fā)音網(wǎng)絡(luò)



責(zé)任編輯:admin



微信公眾號

  • 上一篇:Viterbi算法在語音識別中的應(yīng)用
  • 下一篇:發(fā)音變異的決策樹模型


  • 《譯聚網(wǎng)》倡導(dǎo)尊重與保護(hù)知識產(chǎn)權(quán)。如發(fā)現(xiàn)本站文章存在版權(quán)問題,煩請30天內(nèi)提供版權(quán)疑問、身份證明、版權(quán)證明、聯(lián)系方式等發(fā)郵件至info@qiqee.net,我們將及時(shí)溝通與處理。


我來說兩句
評分: 1分 2分 3分 4分 5分
評論內(nèi)容:
驗(yàn)證碼:
【網(wǎng)友評論僅供其表達(dá)個(gè)人看法,并不表明本站同意其觀點(diǎn)或證實(shí)其描述?!?
評論列表
已有 0 條評論(查看更多評論)