英语翻译软件视角下的翻译改正算法研究

所属分类：教育论文阅读168次时间：2020-03-10 07:51

本文摘要：摘要目的：使得英语语言文学翻译错语率降低。方法：塑造与实施汉英依存树串实例机器翻译系统，首先对知网运算输入需要翻译的句子同实例库内源语言中的词汇语义相似度进行分析;接着对机器翻译中相似实例检索模块与翻译文诞生模块形成过程进行论述;再采用数据

　　摘要目的：使得英语语言文学翻译错语率降低。方法：塑造与实施汉英依存树串实例机器翻译系统，首先对知网运算输入需要翻译的句子同实例库内源语言中的词汇语义相似度进行分析;接着对机器翻译中相似实例检索模块与翻译文诞生模块形成过程进行论述;再采用数据翻译模型对英语语言的准确翻译进行更进一步校对;最后对三种不同机器翻译系统进行相关实验比较分析。结果：表明本文所采用英语依存树串实例机器翻译系统翻译的方法，其译文具有较高准确性与稳定性。结论：该英语机器翻译的错误大大降低。

　　关键词英语翻译;机器翻译;汉英依存树串实例机器翻译系统;语义语言机器翻译系统

论文翻译

　　英语教育论文英汉语法衔接手段翻译方法

　　摘要：本文从照应、替代、省略、连接四种语法衔接手段探讨了英汉语衔接手段的差异以及调整英译汉语法衔接手段的常用翻译方法。英汉语法机制差异突出体现在形合与意合的问题上，两种语言间的差异经常成为翻译的障碍。语法衔接机制发生冲突时，为了维持语篇的连贯性，有必要根据译入语的衔接原则调整衔接模式。

　　机器翻译是属于自然语言翻译范畴的核心部分，通常具有较高的社会应用价值。机器翻译也是属于一种英语语言文学翻译方法，不过该方法还是凭经验进行译文，它不需要对句子的语法与语义进行更深入了解与分析，就能提升英翻译的效率[1]。但是由于该翻译措施对实例库要求比较严格，而传统的机器翻译一般是运用管道形式逐次运作对最初语料采取词性标识与句子语法分析，从而形成英语句子与语法结构，使得英语翻译过程中出现错迭代传递增多与结构化实例发生错误的情景大大提高，最终使得英语语言文学翻译的错误率也随之提升。为了解决这方面难题，因此本文从英语翻译软件视角下对翻译改正算法进行详细探讨，最终目的就使英语语言文学翻译的准确率得到提高[2]。

　　1依存树到串模型与相关计算

　　1.1依存树到串模型分析

　　三元组属于依存树到串模型，当中是一个翻译对。在此模型中，D的含意为源语言的依存树，S的含意为源语言的目标词语串，A的含意主要用来对D和S两者之间的词对齐关系的描述，根据依存树到串双语对齐模型的实例[3]。上端是源语言的依存树D，D的每个节点主要包括词性与词语两个属性，各词语下的英文代表各单词相应的词语性质。例如动词、名词、形容词通常分别用VV、NN、以及JJ所表示。(此文的词性标注标准来源于StanfordParser词性标注集)。单词中还采用黑色线段一般是用来对词语相互之间的关系进行描述。下端时是中文句子所对应的英文字符串序S,上端与下端的虚线的作用主要对汉语单词节点与英语单词两者之间的对应关系进行描述[3]。

　　1.2知网的词汇语义相近程度

　　近似度的取值范围一般为[0，1]，W1与W2两个不一样的词语之间的含意的近似度为：(,)(,)sinsemanticW1W2maxi1,2,n,j1,2,,ms1is2isim===(1)在(1)式中s1i(i=1,2,,n)与s2i(i=1,2,,m)主要用来对对Wi与W2两个词语中所存在n个与M个概念进行阐述，两个词语中所表达的含意近似度是两个词语的概念近似最大值。词语定义的近似度可以使用定义的义原相近的程度进行表述，使用如下(2)式的运算义原p1与p2的近似度。αα+=dSim(P,P)12(2)在(2)式中，α代表能够调控的参数，d代表两个义原在义原树中的路径距离，它的数值通常为0或者正数。

　　1.3对数线性模型

　　对于该模运用多特点的思考识别模型。依据一个假设的句子：ffffIjJJI=,，形成设文eeIejeJJI=,,，最大的熵的翻译模型如下：(,)1eheeJIJmIMmmJI∑==λ(3)对数线性模型可拓展性比较强，能够依据不同的目标要求对对应特点进行设定，还能够把数种不同的语言学措施应用到机器翻译中来。机器翻译系统的主要表现方式为正向译文概率、反向译文概率、以及译文语言模型等特征函数。立足于翻译系统的实际要求自动设置特点函数与相应的特权权重，再参照上式(3)就能够得到对形成译文得分最高为最佳译文[4]。

　　1.4机器翻译系统分析

　　运用Sato&Nagao措施分析依存机构，将依存树到串对齐实例的源语言依存树进行它的表现方式进行论述，再经配套论述的方式对实例库内的实例片段进行测试，从而获得所需要录入的句子，相近的实例测试得到完成。配套体现的表达方式通常为三种形分别为增加、过滤、以及替换。在未有目标语词串中，该目标语词串主要指依存树架构关系层，它相对应的翻译出来的语句表现形式也将发生改变[5]。

　　源语言的依存树到串实例D3与实例D5在实例库的结构。源语言的依存树到串实例D3与实例D5在实例库的结构展现在实际库例中，比如类似于e21、e51的标识，一般是采用单词的顺序对其实施标号，S(目标词语串)的标号是在前面标识了“e”。比如将中文“她买了一本英语书”，再与源语言实例D3与D5相互融合，通过测试而取得[c21,[r,c23[c51]]]是属于它当中一个相对应的表现形式，经过此目标配套表现形式获得录入语句的目标语译文是Ibuyapoliticsbook。

　　根据该文对数性模型，采用特征函数具体表现如下：(1)正向译文概率与反向译文概率，倘若单词量一样时，两种句子(即译句与被译句)之间具有较多一样的单词量，如果使用特征函数就更加容易形成比较正确的翻译。(2)语言模型。倘若要形成高质量的译文，通常是就要使用这种函数来进行考核，提升译文句子流利、顺畅程度。此文以目标语言的语言模型，得出目标语言中所包含的译文片断的概率。

　　2相关试验

　　2.1试验设定

　　试验语料使用是CWMT2015官方测评用的汉英新闻语料，由于受到实验系统限止，从中挑选出42万句语料，当然此语料也是属于英语与汉语的平行语料，把这些挑选出来的语料看成为英汉双语实际应用库例中的初始语料[6]。把CWMT2015国家测试集看成检测集，语言栏是指检测的句子语种为英语与汉语两种语言，开发集栏主要是指CWMT2015官方评测用的测试集中挑选出来汉英新闻语料数量作为初始语料，检测集栏中是指实验被测试的语句数量。

　　2.2试验结果与剖析

　　为了对此文的依存树串实例机器英语翻译系统的有效果性进行测试，本试验的语料库作为基础，然后对本文系统进行对比分析，三个机器翻译系统译文结果，就是指属于等待评价译文与参考译文的n-单位片段实现的比较分析。该列表当中的数值，也叫BLEU值，倘若计算结果匹配值越大，那么等待评价的译文质量就越佳。第三列表中数值，也叫NTST值。该数值衡量译文质量的标准参考值，该列表数值越高，说明其等待评价译文的质量就越佳。

　　通过数据比较能够知道，第二列与第三列表中此文依存树串实例机器英语翻译系统数值比其它两款机器翻译系统的数值均要高，这就体现依存树串实例机器英语翻译系统的性能更佳，是属于一种译文质量较好的翻译系统。本试验是通过上文所论述的三种不一样的翻译系统将中文翻译成为英文结果，从中整理某一部分的译文进行分析。所检验的中文语句是“信息产业展现快速发展的趋势”，通过三种不同的译文系统进行翻译，而所得到译成英文的情况。

　　三种翻译系统的译文差异进行分析，发现主要在于对“快速发展”这词，语义语言机器翻译系统的译文为“Keepingthemomengtumgoing”,与开源统计机器翻译系统的译文“fastchange”的原词具有很高差异，这与英语的语议与语法均不相符。而依存树串实例机器英语翻译系统对此词的译文结果，尽管与相关参考译文相比较，还存在一些不足，比如语序没有统一，但是能与语义要求相符，因此其准确性高[7]。两种系统对实验语料库中的语句进行英文翻译成汉语与汉语翻译成英文的结果。两个表中第一列是两种系统对每个句子平均翻译结果，语义语言机器翻译系系数大于此文依存树串实例机器英语翻译系统的平均数，这就体现了此文依存树串实例机器英语翻译系统的翻译的结果错误较少。

　　再对两表中的准确翻译召回率进行比较，就能比较清楚地看出此依存树串实例机器英语翻译系统比语义语言机器翻译系统要高;对结果中首位准确翻译率与结果中前两位准确翻译率进行比较，发现此文依存树串实例机器英语翻译系统较语义语言机器翻译系统均要高。通过以上比较分析可知，此文依存树串实例机器英语翻译系统能够使得翻译准确率得到提升，具有较强的英语语言文学翻译功能[8]。

　　3结论

　　本文通过塑造依存树串实例机器英语翻译系统，并采取相关实验，通过从译文中各句的翻译结果(平均数)、译文结果中准确翻译的召回率、译文结果准确翻译率(第一位)、译文结果中准确翻译率(前两位)等方面进行比较分析，最后实验结果表明，依存树串实例机器英语翻译系统较语义语言机器翻译系统翻译译文准确率更高，由此更加体现了该系统具有较强的英语语言文学翻译功能。

　　参考文献

　　[1]汪昆,宗成庆,苏克毅.统计机器翻译与翻译记忆的动态融合方法三[J].中文信息学报,2015,29(02):87-89.

　　[2]季春元,熊泽金,侯艳芳,陈明.基于人机交互的网络化智能翻译系统设计[J].自动化与仪器仪表,2019,08(25):25-28.

　　[3]王丹丹.基于实例的汉英依存树到串机器翻译方法研究[D].北京：北京交通大学,2016.