计算机软件及计算机应用论文_面向神经机器翻译
05-12文章摘要:虽然源语言和目标语言单语数据已被证明通过正向翻译和反向翻译改进神经机器翻译非常有用,但如何更有效的同时使用还值得更深入的研究。为了在神经机器翻译中更有效地同时使用源语言和目标语言单语数据,本文提出了一种基于集束搜索的正向翻译和基于最优N随机采样的反向翻译的组合方法。具体地,将该方法应用于第十七届全国机器翻译大会(CCMT 2021)汉英和英汉新闻领域的翻译评测任务,实验结果表明,与其他常用的单语数据增强方法相比,该方法可以更有效地提升神经机器翻译模型的翻译质量。此外,在使用该方法之前,先进行领域知识迁移还可以进一步取得翻译质量的提升。
文章关键词:
论文作者:吴章淋 魏代猛 李宗耀 於正哲 商恒超 陈潇雨 郭嘉鑫 王明涵 雷立志 陶士敏 杨浩 秦璎
作者单位:华为文本机器翻译实验室
论文分类号:TP391.2

