會員中心 |  會員注冊  |  兼職信息發(fā)布    瀏覽手機版!    精選9.9元!    人工翻譯    英語IT服務 貧困兒童資助 | 留言板 | 設為首頁 | 加入收藏  繁體中文
當前位置:首頁 > 機翻技術 > 識別技術 > 正文

切分歧義處理知識

發(fā)布時間: 2022-12-14 09:15:27   作者:etogether.net   來源: 網(wǎng)絡   瀏覽次數(shù):
摘要: 根據(jù)歧義字段的影響范圍,可把歧義字段分為三種,即詞匯級歧義、句子級歧義和語境級歧義。


歧義處理的復雜性,不僅在于歧義字段本身的多樣性,還在于歧義字段的影響范圍和消除歧義所需的知識的多樣性。根據(jù)歧義字段的影響范圍,可把歧義字段分為三種,即詞匯級歧義、句子級歧義和語境級歧義。


1. 詞匯級歧義

一個歧義字段,雖然可能有兩種切分方式,但其中的一種切分形式在一般條件下是不會出現(xiàn)的。部分交集型歧義字段屬于這種情況。例如:“太平淡”只能切分為“太  平淡”,“天下午”只能切分為“天  下午”(昨天下午他來了)。


2. 句子級歧義

一個歧義字段,在不同的句子中有不同的切分方式,但在具體的句子中只有一種切分形式是正確的。大多數(shù)多義組合歧義字段和部分交集型歧義字段屬于這種情況。例如:

“馬上”:他從馬上下來;他馬上就到。

“將來”:他將來上海;將來他要到上海工作。

“日本報”:1月20日本報刊出了一條消息;日本報刊出了一條消息。


3. 語境級歧義

一個歧義字段,在相同的句子中也可有不同的切分方式,具體選擇何種切分方式必須根據(jù)上下文才能確定。這種最復雜的情況,包括少數(shù)多義組合歧義字段和交集型歧義字段。例如:


“學生會”:學生會寫文章。

“乒乓球拍賣”:乒乓球拍賣完了。


由此可見,解決歧義切分問題,需要多方面的知識,包括詞匯信息、句法信息、語義信息和上下文信息。事實上,即使是詞匯級的歧義現(xiàn)象,往往也必須用上句法信息,甚至語義信息才能消除。例如:“白天鵝”的錯誤切分形式“白天  鵝”,作為名詞和名詞的組合,也能構成一個合乎語法規(guī)則的名詞性詞組,只有使用語義限制條件,才能判斷為錯誤形式。至于更復雜的歧義現(xiàn)象,還需要更多的信息。


責任編輯:admin


微信公眾號

  • 上一篇:復旦分詞系統(tǒng)介紹
  • 下一篇:機械分詞方法


  • 《譯聚網(wǎng)》倡導尊重與保護知識產(chǎn)權。如發(fā)現(xiàn)本站文章存在版權問題,煩請30天內提供版權疑問、身份證明、版權證明、聯(lián)系方式等發(fā)郵件至info@qiqee.net,我們將及時溝通與處理。


我來說兩句
評分: 1分 2分 3分 4分 5分
評論內容:
驗證碼:
【網(wǎng)友評論僅供其表達個人看法,并不表明本站同意其觀點或證實其描述。】
評論列表
已有 0 條評論(查看更多評論)