會員中心 |  會員注冊  |  兼職信息發(fā)布    瀏覽手機版!    精選9.9元!    人工翻譯    英語IT服務 貧困兒童資助 | 留言板 | 設為首頁 | 加入收藏  繁體中文
當前位置:首頁 > 機翻技術(shù) > 識別技術(shù) > 正文

語音識別中的問題

發(fā)布時間: 2023-09-06 09:22:17   作者:etogether.net   來源: 網(wǎng)絡   瀏覽次數(shù):
摘要: 語音非常有效和方便,可以讓你的雙手自由地做其他工作,不過,直到最近,語音識別系統(tǒng)才做到足夠準確和高速。


語音在人類交流模式中占支配地位。當然,書面語言是很重要的,很多知識都是以書面語言的形式一代一代地傳下來的,但在日常的交流中,語音還是最主要的模式。很自然地可以假設語音也是人機交互的首選模式。語音非常有效和方便,可以讓你的雙手自由地做其他工作。不過,直到最近,語音識別系統(tǒng)才做到足夠準確和高速,以支持有效的應用。隨著新的識別技術(shù)的產(chǎn)生和更快速的計算機的出現(xiàn),這種轉(zhuǎn)變非常之快。


語音識別系統(tǒng)分為兩類,分別是孤立詞識別系統(tǒng)和連續(xù)語音識別系統(tǒng)。孤立詞識別系統(tǒng)一次只識別一個單詞。要使用這樣一個系統(tǒng),必須在單詞之間有一個停頓。連續(xù)語音識別系統(tǒng)可以識別我們平常說話那樣的語音,其中的單詞在一個連續(xù)流中一起說出。目前,市場上大部分系統(tǒng)都使用孤立詞識別技術(shù)。連續(xù)語音識別系統(tǒng)處于積極的開發(fā)之中,不過,已經(jīng)很接近實際的應用。其他區(qū)分各種不同系統(tǒng)的主要因素是詞匯量和能夠處理的說話者的范圍。一些低端系統(tǒng)可以識別單個用戶的30個左右的單詞,而高端系統(tǒng)能夠識別多個說話者的20000個單詞。當比較不同系統(tǒng)的識別率的時候,很重要的一點是要記住,要在大詞匯量、多說話者的連續(xù)語音識別中達到很高的準確率是非常困難的。


雖然在口語和書面語言的處理中都可以使用一些相同的基本技術(shù),如句法分析、語義解釋和上下文解釋,但還是存在一些顯著的區(qū)別,會對這兩種系統(tǒng)的設計發(fā)生影響。舉例來說,對于口語輸入,系統(tǒng)必須處理不確定性。在書面語言中,系統(tǒng)準確地知道要被處理的單詞。而在口語中,用戶說的是什么只是一個猜測。而且,口語在結(jié)構(gòu)上和書面語很不相同。實際上,有時一份完全能夠理解的語音的記錄在閱讀時卻令人無法理解??谡Z的表現(xiàn)更增量化,每次一個短語,包含了書面語中所沒有的豐富的語調(diào)信息。口語中還包含很多更正,說話者用來糾正或者修改他剛才說的話。更進一步,口語對話有豐富的表示認可或者確認的交互,以維持一次對話,而這些在書面形式中都不會出現(xiàn)。


口語理解系統(tǒng)的基本結(jié)構(gòu)如圖C.1所示,其中整個的自然語言系統(tǒng)都壓縮到了一個框中。說話者發(fā)出的聲音首選通過一個模擬/數(shù)字轉(zhuǎn)換器轉(zhuǎn)換成數(shù)字形式。這種信號通過處理抽取出各種特征,如在不同頻率上的聲音強度和隨著時間流逝聲音強度發(fā)生的變化。這些特征用

做語音識別系統(tǒng)的輸入,語音識別系統(tǒng)一般都采用隱馬爾可夫模型(HMM,Hidden Markov Model)技術(shù)來確定最有可能產(chǎn)生這種語音的詞語序列。然后,語音識別器輸出這種最可能的詞語序列作為自然語言理解系統(tǒng)的輸入。當自然語言系統(tǒng)需要產(chǎn)生一個語音的表示時,它將句子傳遞給一個將單詞翻譯成音素序列并決定語調(diào)輪廓的模塊,然后將這些信息傳遞給一個語音合成系統(tǒng),語音合成系統(tǒng)產(chǎn)生口語輸出。


語音理解系統(tǒng)的結(jié)構(gòu).png

圖C.1 語音理解系統(tǒng)的結(jié)構(gòu)



責任編輯:admin


微信公眾號

  • 上一篇:語音識別和自然語言理解
  • 下一篇:示例:分布式SVM的Pegasos算法


  • 《譯聚網(wǎng)》倡導尊重與保護知識產(chǎn)權(quán)。如發(fā)現(xiàn)本站文章存在版權(quán)問題,煩請30天內(nèi)提供版權(quán)疑問、身份證明、版權(quán)證明、聯(lián)系方式等發(fā)郵件至info@qiqee.net,我們將及時溝通與處理。


我來說兩句
評分: 1分 2分 3分 4分 5分
評論內(nèi)容:
驗證碼:
【網(wǎng)友評論僅供其表達個人看法,并不表明本站同意其觀點或證實其描述?!?
評論列表
已有 0 條評論(查看更多評論)