- 簽證留學(xué) |
- 筆譯 |
- 口譯
- 求職 |
- 日/韓語(yǔ) |
- 德語(yǔ)
發(fā)音詞典實(shí)際上既可以用于ASR(自動(dòng)語(yǔ)音識(shí)別)系統(tǒng),也可以用于TTS(文本-語(yǔ)音轉(zhuǎn)換)系統(tǒng),盡管由于這兩種系統(tǒng)的需要不同,發(fā)音詞典的內(nèi)容可能會(huì)有所不同。
最簡(jiǎn)單的發(fā)音詞典只包含由單詞及其發(fā)音組成的一個(gè)詞表。
這樣的大規(guī)模的在線發(fā)音詞典有三部,分別是PRONLEX,CMUdict和CELEX。它們可用于語(yǔ)音識(shí)別,也可以用于語(yǔ)音合成。PRONLEX發(fā)音詞典(LDC,1995)是為語(yǔ)音識(shí)別而設(shè)計(jì)的,包含90694個(gè)詞形的發(fā)音,可覆蓋多年來(lái)在華爾街日?qǐng)?bào)語(yǔ)料庫(kù)和Switchboard語(yǔ)料庫(kù)(Switchboard Corpus)中使用的單詞。CMUdict發(fā)音詞典也是為自動(dòng)語(yǔ)音識(shí)別(ASR)的目的而開(kāi)發(fā)的,包含大約100000個(gè)詞形的發(fā)音。CELEX發(fā)音詞典(Celex,1993)包括《牛津高級(jí)英語(yǔ)學(xué)習(xí)詞典》(1974)(41000個(gè)原形詞)和《朗文現(xiàn)代英語(yǔ)詞典》(1978)(53000個(gè)原形詞)的全部單詞,總共包含160595個(gè)詞形的發(fā)音。CELEX發(fā)音詞典是英國(guó)英語(yǔ)發(fā)音,其他兩部發(fā)音詞典是美國(guó)英語(yǔ)發(fā)音。每部發(fā)音詞典所用的音子集(phone set)不一樣,CMU和PRONLEX的音子集是從ARPAbet推出來(lái)的,CELEX 的音子集是從IPA推出來(lái)的。三部發(fā)音詞典都把重音表示為三層:主重音、次重音和無(wú)重音。圖2 說(shuō)明了armadillo這個(gè)詞在三部發(fā)音詞典中的發(fā)音情況。
圖2 在三部詞典中單詞armadillo的發(fā)音。我們不解釋這些特殊的發(fā)音符號(hào),對(duì)于每種發(fā)音都給出了等價(jià)的IPA音標(biāo)。在CMU發(fā)音詞典中,對(duì)于非重讀元音([a],[等),用0級(jí)重音來(lái)表示。在IPA標(biāo)音中,在元音下面加下劃線來(lái)表示。注意,在英國(guó)英語(yǔ)的CELEX的發(fā)音中r-脫落的現(xiàn)象以及元音使用[??]而不使用[o?]的表示方法