机器翻译中汉语动结式生成的过程和困难(1)
2015-11-05 02:23
导读:计算机应用论文论文,机器翻译中汉语动结式生成的过程和困难(1)论文样本,在线游览或下载,科教论文网海量论文供你参考:
1.引言 当 电子 计算 机1946年问世的时候,人们就提出了
1.引言
当 电子 计算 机1946年问世的时候,人们就提出了机器翻译的想法,并且在1954年进行了第一次机器翻译试验。然而与后来的各种语言信息处理 研究 和 应用 (语言信息检索、文本自动分类、自动文摘、信息提取等等)相比,机器翻译却是进展最慢的。学者们倾其大半生精力、商家投入为数可观的资金,经历五十多年不懈的研究和开发,得到的成果或者产品却常常不能令人满意。
原因是什么呢?从语言研究的角度来说,机器翻译系统 分析 、理解和生成 自然 语言的能力都还不到位,处理不了的语言现象很多:有的是句子结构层次弄错了,有的是结构关系弄错了,有的是成分之间的语义关系弄错了,有的是词义辨识错了,还有的错误是源语和目标语之间的对比差异造成的。下面是机器翻译处理汉语动结式不成功的几个例子(来自三个机器翻译系统)。
先看生成的情况,机器翻译 目前 还很难生成汉语的动结式,所以我们很少在汉语译文里见到含有动结式的句子。对于下面这个英译汉的例子,三个系统都不能翻译成“他把地扫干净了”:
He swept the floor clean. * 他干净地扫地了。
* 他清扫清洁的地板。
* 他清扫地板干净。
再看汉语动结式翻译成
英语 的例子,它们可以说明目前机器翻译系统分析和理解汉语动结式的能力:
他踢坏了三双鞋。 *He plays three pairs of evil shoes.
*He kicked three pairs of shoes bad.
*Him kick spoil 3 pairs of shoes.
这段路把妈妈走累了。* The way make mother tired after the walk.
*This section of way was walked mother tired(ly).
您可以访问中国科教评价网(www.NsEac.com)查看更多相关的文章。 *This road mother walk tired.
大家吃腻了剩菜。*Everybody has fedded up with the leftovers.
*That everybody ate greasy(ly)surplus vegetable.
*All eat,is loathe to leave vegetable.
下面我们只讨论动结式的生成 问题 ,其中不包括以下三种情况:1)补语用“得”字连接的;2)补语虚化的,如:“抓住”、“买着”、“看完”、“办成”等;3)补语和动结式的宾语有固定搭配关系的,如:“说走了板”、“看愣了神”、“苦出了头”等等。
2.机器翻译中的动结式问题
为了说明机器翻译如何处理动结式述语结构,我们需要先看看机器翻译的过程。下图说明了机器翻译的原理,也是机器翻译的整个过程。
附图
图1 机器翻译的过程
显然,这是一个理想化的机器翻译过程。从S到I再到T的过程是中介语言的翻译策略,中介语言通常是某种独立于源语和目标语的逻辑表达式。如果是英译汉,对英语的分析和理解要从表层深入到底层,得到描述句子意义的中介语言逻辑表达式。同样地,汉语也要从底层到表层一步一步生成。分析时从表层到底层走得越深,生成时从底层回到表层的过程也就越复杂。因此,需要分别对这两种语言的句法和语义系统作深入的研究。实际上目前大部分机器翻译系统都作不到这个程度,常见的翻译策略是直接法或转换法,或直接和转换相结合的混合 方法 。我们可以通过一个英译汉的例子对直接法、转换法和中介语言法这三种翻译策略作一个比较:
You get good reception on your radio.(摘自某产品
说明书)
译句1 你得到好的接收在你的收音机上。
译句2 你用你的收音机得到好的接收。
译句3 你的收音机接收情况良好。
(科教论文网 lw.nSeAc.com编辑发布)
在机器翻译系统中,用直接法可以得到译句1;用基于句法的转换法,再加上一些语义关系的分析,能得到译句2;译句3是基于理解的,用中介语言法有可能作到。显然,前一节关于动结式英译汉和汉译英的例子,都不是基于理解的翻译。