會員中心 |  會員注冊  |  兼職信息發(fā)布    瀏覽手機版!    精選9.9元!    人工翻譯    英語IT服務 貧困兒童資助 | 留言板 | 設為首頁 | 加入收藏  繁體中文
當前位置:首頁 > 機翻技術 > 識別技術 > 正文

文本 - 語音轉換中的韻律

發(fā)布時間: 2022-06-29 09:18:56   作者:etogether.net   來源: 網(wǎng)絡   瀏覽次數(shù):
摘要: 句子的韻律結構是指某些詞似乎自然地結合在一起,而某些詞似乎有明顯的間隔或者彼此分開。


從符合正詞法的文本到語音的轉錄過程只是描述了在實際生成語音的文本-語音轉換系統(tǒng)TTS中輸入的主要部分的產(chǎn)生過程。輸入的另一個重要部分是韻律(prosody)。韻律這個術語一般用于表示句子發(fā)音中沒有用從詞典中推導出的語音序列來描寫的那些方面。韻律是在比語音更長的語言單位上起作用的,因此,韻律的研究有時又稱為超音段現(xiàn)象(suprasegmental phenomena)的研究。


1. 韻律的音系學性質

韻律有三個主要的音系學性質:突顯度(prominence)、結構(structure)和調(tune)。


前面曾經(jīng)討論過突顯度,突顯度是用于覆蓋重音和重讀的一個廣義的術語。突顯度是音節(jié)的一個性質,而且它的描述通常都是相對的,只是說明一個音節(jié)比另一個音節(jié)顯得更突出。發(fā)音詞典要標出詞重音,例如table的重音在第一個音節(jié),而machine的重音在第二個音節(jié)。諸如there, the和a這樣的虛詞,通常是完全不重讀的。當若干個詞結合在一起時,它們的重音模式也會結合起來,在更大的組合體中形成一個更大的重音模型。重音結合時要遵從一些規(guī)則。例如,諸如new truck(新卡車)這樣的形容詞-名詞組合,其重音在右側的詞(new *truck),而諸如*tree surgeon(樹木醫(yī)生)這樣的名詞-名詞組合,其重音則在左側。不過,一般地說,這樣的規(guī)則都有例外,所以重音的預測就是一個非常復雜的問題。例如,名詞-名詞組合*apple cake(蘋果蛋糕)的重音在第一個單詞,而名詞-名詞組合apple *pie(蘋果餡餅)的重音則在第二個單詞(Liberman and Sproat,1992; Sproat,1994,1998a)。還有,韻基(rhythm)的作用可以使重讀音節(jié)稍微有所擴展,例如,city *hall(市政廳)和*parking lot(停車區(qū))結合成*city hall *parking lot(Liberman and Prince,1977)。最后,重音的位置受到話語因素的強烈影響,例如,新詞語或做焦點的詞語經(jīng)常重讀。


句子的韻律結構是指某些詞似乎自然地結合在一起,而某些詞似乎有明顯的間隔或者彼此分開。通常用韻律短語(prosodic phrasing)來描述韻律結構。具有同樣的韻律短語結構的一段話語應該具有同樣的句法結構。例如,句子“I wanted to go to London, but could only get tickets for France”似乎包含兩個主要的韻律短語,它們的邊界就在逗號處。這些較大的韻律單位通常使用的術語有:語調短語(intonational phrase或IP) (Beckman and Pierrehumbert,1986)、語調單位(intonation unit) (Du Bois et al.,1983)、調單位(tone unit)(Crystal,1969)。另外,在第一個短語中,似乎還有更小的韻律短語邊界 [通常稱為中間短語(intermediate phrase)] 分割單詞:“I wanted I to go l to London”。


韻律短語和次短語的精確定義以及它們與諸如子句和名詞短語之類的句法短語及語義短語之間的關系,過去一直是而且現(xiàn)在仍然是很多爭論的主要內容(Chomsky and Halle,1968; Langendoen,1975; Streeter, 1978; Hirschberg and Pierrehumbert, 1986; Selkirk, 1986; Nespor and Vogel, 1986; Croft, 1995; Ladd,1996; Ford and Thompson,1996; Ford et al.,1996)。盡管這個問題十分復雜,學者們還是提出了一些算法,試圖把輸入文本的句子自動分割為一些語調短語。例如,Wang and Hirschberg(1992), Ostendorf and Veilleux(1994), Tayler and Black(1998)以及其他一些學者曾經(jīng)根據(jù)周圍單詞的詞類特征、在當前單詞和下一個單詞中語段的長度特征、從語段的開始算起或從語段的結尾算起的潛在邊界的距離特征,以及周圍的單詞是否有重音等特征,建立統(tǒng)計模型來預測語調短語的邊界。



微信公眾號

[1] [2] [下一頁] 【歡迎大家踴躍評論】
  • 上一篇:發(fā)音變異的決策樹模型
  • 下一篇:發(fā)音詞典的相關技術簡單介紹


  • 《譯聚網(wǎng)》倡導尊重與保護知識產(chǎn)權。如發(fā)現(xiàn)本站文章存在版權問題,煩請30天內提供版權疑問、身份證明、版權證明、聯(lián)系方式等發(fā)郵件至info@qiqee.net,我們將及時溝通與處理。


我來說兩句
評分: 1分 2分 3分 4分 5分
評論內容:
驗證碼:
【網(wǎng)友評論僅供其表達個人看法,并不表明本站同意其觀點或證實其描述。】
評論列表
已有 0 條評論(查看更多評論)