机器翻译:人工智能的一项重要技术

今天,让我们来介绍机器翻译的基本知识。满是干货,别错过了!

机器翻译实际上是通过计算机将一种自然语言翻译成另一种自然语言的过程。基本过程分为三个部分:预处理、核心翻译和后处理。

预处理是机器翻译对语言进行规范化处理,用标点符号将长句划分成若干短句,过滤一些与意义无关的语气词和词语,机器翻译将一些数字和非标准表达整合成标准句。

机器翻译核心翻译模块是将输入字符单元和序列翻译成目标语言序列的过程,是机器翻译中最关键、最核心的部分。

机器翻译后处理模块将翻译结果转化为事例,拼接建模单元,对特殊符号进行处理,使机器翻译结果更符合人们的阅读习惯。

在讨论机器翻译的技术原理之前,我们先来谈谈机器翻译技术的发展历史

20世纪80年代,基于规则的机器翻译开始应用,这是机器翻译的第一代技术。随着机器翻译的应用越来越复杂,基于规则的机器翻译的局限性开始显现。随着应用场景的增多,需要的规则越来越多,规则之间的冲突也逐渐显现。

于是许多研究者开始思考机器能否自动从数据库中学习相应的规则。1993年,IBM提出了基于词的统计翻译模型,标志着第二代机器翻译技术的兴起。

2014年,谷歌和蒙特利尔大学提出了第三代机器翻译技术,即端到端的神经机器翻译,这标志着第三代机器翻译技术的到来。

在看了机器翻译技术的迭代发展之后,让我们了解下三代机器翻译的核心技术:规则机器翻译、统计机器翻译和神经机器翻译。

由于源语言和目标语言不在同一个系统中,句法顺序也有很大差异,直接拼接的结果往往不理想。

但这里还有一个问题。只有当语言规则很强,机器能够分析时,这种方法才更有效。

因此,有研究者在此基础上提出了基于规则的机器翻译能否借助人脑翻译来实现?

这涉及到中间语言。首先,源语言用中间语言描述,然后借助中间语言翻译成我们的目标语言。

然而,由于语言的复杂性,借助中间语言很难实现对源语言和目标语言的准确描述。

第二代机器翻译技术是统计机器翻译,其核心是设计概率模型对翻译过程进行建模。

例如,我们用X表示原语句子,用y表示目的语句子。任务是找到一个翻译模型θ。

最早应用于统计翻译的模型是源渠道模型。在这个模型中,我们假设源语言文本x是通过对目标语言文本y进行某种奇怪的编码得到的,那么翻译的目的就是将y还原为x,这也是一个解码过程。

因此,我们的翻译目标函数可以设计为最大化pr(│)。通过贝叶斯公式,我们可以将pr(│)分为两个术语,即pr()的语言模型和pr(|)的翻译模型

如果把目标函数的两边作为对数,就可以得到对数线性模型,这也是我们在工程中实际使用的模型。

对数线性模型不仅包括翻译模型、语言模型,还包括重排序模型、失真模型和字数惩罚模型。通过这些模型,可以实现从源语言到目标语言的翻译。

在介绍了统计机器翻译的知识之后,让我们来看看基于短语的统计翻译模型的三个基本步骤

1、源短语切分:将源语言句子切分成若干短语

2、源短语翻译:翻译每个源短语

3、目的语重组:将目的语按一定顺序组合成句子

在讨论了基于规则的机器翻译和基于统计的机器翻译之后,让我们来看看端到端的神经机器翻译。

神经机器翻译的基本建模框架是端到端序列生成模型,它是将输入序列转换为输出序列的框架和方法。

其中有两个核心部分:一个是如何表示输入序列(编码),另一个是如何获得输出序列(解码)。

对于机器翻译,它不仅包括编码和解码,还引入了额外的注意机制来帮助我们调整顺序。

现在我们来看看基于RNN的神经机器翻译过程

首先通过分词得到输入源语言的词序,然后用一个词向量表示每个词,得到相应的词向量序列,然后用前向RNN神经网络得到前向编码表示。

然后利用反向RNN得到其反向编码表示。最后,将正向和反向编码表示进行拼接,并利用注意机制来预测哪些单词在什么时候需要翻译。通过不断的预测和翻译,可以得到目的语的译文。

THE END
1.终于有人总结了人工智能知识!(非常详细)零基础入门到精通,收藏这一篇就本篇系统而全面地概述了人工智能的知识体系。 首先,我们定义了人工智能的基本概念,这是理解整个领域的基础。随后,通过对人工智能发展历程的梳理,我们展示了其从诞生到如今的演变轨迹,凸显了其在科技进步中的重要地位。 接下来,我们深入探讨了机器学习与深度学习这两项核心技术。它们作为人工智能领域的两大支柱,不仅推动https://blog.csdn.net/xx16755498979/article/details/144030340
2.人工智能原理与技术《人工智能原理与技术》的主要作者大部分是我校重点学科的学术带头人、博士导师。他们从事高水平的科研项目,他们的著作含有独特的见解,是科研成果的结晶,代表了学校的学术水平和发展趋势。书名: 人工智能原理与技术 作者:俞瑞钊 史济建 出版社: 浙江大学出版社 出版https://baike.sogou.com/v73828497.htm
3.人工智能原理技术及应用——安俊秀叶剑陈宏松等编著本书主要向读者介绍当代人工智能技术的入门知识,特别是以深度学习为代表的机器学习方法。内容包括人工智能的概念、分类和原理,阐述了人工智能的三大流派等。着重介绍了人工智能的相关技术和算法,包括机器学习、深度学习、强化学习、自然语言处理、机器视觉、机器人等。本书从基本原理概念、基础算法、基本理论应用三个方面对http://m.cmpedu.com/books/book/5605715.htm
4.人工智能原理北京化工大学人工智能原理由北京化工大学组织开设,授课教师为韩永明、刘勇、江志英等5位老师2023春 开课时间:2023-01-11 至2023-07-25969人已报名 已结课 课程介绍 随着社会信息化的飞速发展,一项划时代的技术正在掀起新的技术革命浪潮,那就是人工智能。人工智能研究什么?人工智能的理论基础是什么?其最新的发展与应用会如何https://www.xuetangx.com/course/buctP0854KC007351/14773507
5.2万字长文助你快速入门AIGC:包含底层原理应用嘲产业上下游一、技术定义 AIGC全称为AI-Generated Content,指基于生成对抗网络GAN、大型预训练模型等人工智能技术,通过已有数 据寻找规律,并通过适当的泛化能力生成相关内容的技术。与之相类似的概念还包括Synthetic media,合成式媒体,主要指基于AI生成的文字、图像、音频等。 https://www.shangyexinzhi.com/article/8375292.html
6.解密人工智能:原理技术及应用首页 馆藏纸本 图书详情 解密人工智能 :原理、技术及应用 出版社:化学工业出版社 ISBN:9787122417954 出版年:2023 作者:胡征 资源类型:图书 细分类型:中文文献 收藏单位馆藏地在架状态索书号 宁波材料技术与工程所阅微楼二层西侧202在架上TP18-49/10 https://www.las.ac.cn/front/book/detail?id=87c1c035e70f6995242c9f50f772cdb2
7.人工智能技术专题「入门到精通系列教程」零基础带你进军人工许多人对AI技术有兴趣,但由于其知识点繁多,难以系统学习,学习没有方向等等问题。我们的专栏旨在为零基础、初学者和从业人员提供福利,一起探索AI技术,从基础开始学习和介绍。让你从零基础出发也能学会和掌握人工智能技术。 专栏说明 本专题文章以及涉及到整体系列文章主要涵盖了多个流行的主题,包括人工智能的历史、应用https://blog.51cto.com/alex4dream/6535665
8.心电图人工智能软件技术审评指导原则(附全文)检测资讯需详述产品的工作原理,例如:基于人工智能技术对心电图特征进行分析处理、对心律失常、心肌梗塞和ST-T异常自动识别等。对于软件安全性级别为中等、严重级别的产品,全新类型在软件研究资料中以算法为单位,提交每个人工智能算法或算法组合的算法研究报告;成熟类型在软件研究资料中明确算法基本信息即可,无需提供算法研究资料。http://www.anytesting.com/news/1936081.html
9.AI人工智能文章是如何生成的,有哪些生成原理?AI人工智能文章是如何生成的,有哪些生成原理? 随着科技的不断发展,人工智能技术逐渐成为了当今社会中备受关注的热门话题。在这其中,人工智能文章生成技术更是备受瞩目。 相比于传统的手动撰写文章方式,AI文章生成技术可以大幅提高文章创作效率,并且在保证质量的前提下节省时间和精力。因此,探究AI文章生成技术的背景和意义https://www.135editor.com/essences/8958.html
10.人工智能驾驶的背景原理当前研究与发展方向人工智能驾驶是指车辆通过人工智能技术实现自动驾驶的能力。这一新兴技术正逐渐引起全球范围内的关注和兴趣。随着科技的不断进步,我们得以目睹人工智能驾驶技术的快速发展和应用。本文将详细介绍人工智能驾驶的背景、原理、当前研究与发展方向。 首先,让我们了解人工智能驾驶的背景。随着世界人口的增长和城市化的加剧,交通拥https://www.qxwz.com/zixun/784258095
11.人工智能原理及应用20230101021721.pdf人工智能原理及应用.pdf,人工智能原理及应用 人工智能的原理及应用摘要人工智能(Artificial Intelligence,AI)一直都处于计算机技术的最前沿,经历了 几起几落……长久以来,人工智能对于普通人来说是那样的可 望而不可及,然而它却吸引了无数研究人员为之奉献才智,从 美国https://m.book118.com/html/2023/0101/8020022053005025.shtm