谷歌翻译的历史(2004年至今):详细分析

已发表: 2024-07-05

机器翻译工具彻底改变了全球通信。 它们使世界各地的人们能够相互交谈、联系和开展业务。 在这篇文章中,我们想回顾一下一直处于这一变化最前沿的一个解决方案的历史:谷歌翻译。

对于许多人来说,谷歌翻译是在线翻译工具。 它是免费的、功能强大的,世界各地有数百万人经常将它用于不同的目的,包括网站翻译。 多年来,该服务引入了许多创新,使自动翻译比以往任何时候都更容易使用。 到目前为止,它已成为人工翻译的有效替代方案。

然而,情况并非总是如此,达到这一点还有很长的路要走。 为了让您更好地了解一路上的发展以及工程师必须克服的障碍,下面我们将介绍谷歌翻译迄今为止的历史。

谷歌翻译的起源(2004-2016)

尽管谷歌翻译于 2006 年正式推出,但其历史实际上可以追溯到 2004 年。出生于俄罗斯的谷歌联合创始人谢尔盖·布林 (Sergey Brin) 对当时的机器翻译工具感到沮丧。

因此,他帮助创建了谷歌翻译,该翻译于 2004 年初上线,只有英语和俄语两种语言。 此版本的 Google 翻译基于 SYSTRAN(一种机器翻译形式)。 即使在当时也是非常不准确的。

渐渐地,谷歌翻译接收了更多语言,但进展缓慢。 尽管如此,它仍然能够翻译整个网页,即使只是翻译成有限的目标语言。

谷歌翻译历史的最早版本

该服务于 2006 年 4 月 28 日推出正式测试版。它带来的一项创新是统计机器翻译。 它是相关语言学家经过数月的工作和研究而开发出来的。 虽然新系统仅适用于阿拉伯语和英语,但这是向前迈出的一大步。 其他语言很快开始利用新的现代机器翻译格式。

谷歌翻译历史2006版

与不准确作斗争

尽管如此,虽然这个版本的谷歌翻译在当时是一个巨大的改进和开创性的,但以现代标准来看它相当不准确,并且经常导致令人困惑的乱码。 主要原因之一是每个输入首先被翻译成英语,然后才翻译成目标语言。 这种两步翻译经常会引入错误和尴尬的措辞(例如这些糟糕的中文翻译)。

他妈的蔬菜 糟糕的中文翻译

此版本的谷歌翻译还使用了基于短语的机器翻译(PBMT)。 这种技术将句子分解成更小的块或短语,然后单独翻译它们,而不是逐字翻译。 PBMT 使用模式来预测最可能的翻译。 大大提高了当时机器翻译的准确性。 然而,尽管该模型接受了数百万份联合国和欧洲议会文件的训练,但它仍然难以适应背景。

直到 2016 年,谷歌翻译继续依赖统计机器翻译,稳步增加更多语言并改进翻译。 十多年来,开发团队和语言学家不断致力于改进算法和翻译准确性。 他们还为该工具添加了一些有用的功能。

结果,谷歌翻译变成了一个相当可靠、易于使用的翻译工具,这是人们迫切需要的。 随着互联网成为人们生活的重要组成部分,向跨越半个地球的其他人交谈和销售已成为常态,人工翻译已无法跟上。

谷歌翻译的早期里程碑

在 2016 年进行重大改革之前,谷歌翻译经历了几个标志着其发展和扩张的关键里程碑。

第一个发布的附加功能是支持单个网页的翻译。 2008 年左右,谷歌翻译获得了将其嵌入网站并将内容翻译成任何语言的能力。 自 2010 年以来,Google Chrome 就能够自动执行此操作。

2010 年,谷歌推出了谷歌翻译 Android 应用程序,一年后又推出了 iOS 应用程序。 这使得不同语言的交流变得更加可行; 您不再需要台式电脑。

大约在这个时候,谷歌翻译还获得了文本转语音等新功能,以显示您的翻译如何发音。 它的应用程序甚至可以识别和翻译图片中的文字。

谷歌翻译应用程序实时翻译示例
图片来源:谷歌

然后,在 2014 年,谷歌收购了 AR 翻译应用程序 Word Lens,并迅速将其功能集成到谷歌翻译及其应用程序中。 Word Lens 更擅长通过图像识别文本。 它还支持通过语音输入进行语音翻译,使活跃的对话更加流畅。

过渡到神经机器翻译(2016-2020)

到 2016 年初,Google 已经支持 100 多种语言。 它还引入了一个短语手册,您可以在其中保存翻译的短语以供以后进行即时翻译、更正其输出的能力以及了解有关您翻译的单词和短语的更多上下文。

谷歌翻译历史2016年更新

但下一个最大的变化已经迫在眉睫。 在庆祝谷歌翻译十周年之际,其母公司正在制定重大转型计划。 同年 11 月,他们推出了谷歌神经机器翻译。

与之前使用的传统的基于短语的机器翻译和统计机器翻译方法不同,这种新方法要优越得多。 它自 2011 年以来一直在制作中。

谷歌翻译 gnmt 与 pbmt 准确性
图片来源:谷歌

神经机器翻译采用深度学习技术,特别是神经网络。 它处理并翻译整个句子,而不是像 PBMT 那样将句子分解成较小的短语。 这种方法更加具有上下文感知能力,因此更加准确和流畅。

NMT 系统接受了海量多语言文本数据集的训练,学习识别单词和短语之间的模式和关系。 随着这个系统接触到更多的数据,它会学习并变得更加熟练。

另外,GMNT 允许该工具直接翻译成目标语言,而不是先翻译成英语。

起初,这种新方法仅适用于英语、法语、德语、西班牙语、葡萄牙语、中文、日语、韩语和土耳其语。 随着时间的推移,越来越多的语言从中受益,翻译质量也随之提高。

这是谷歌翻译历史上的一大飞跃。 但与持续十多年的统计机器翻译不同,谷歌很快就进一步创新。

今日谷歌翻译:深度学习和 Transformers(2020 年至今)

到 2020 年,谷歌已经在机器翻译领域实现了下一次重大飞跃。 GMNT 开始被淘汰,取而代之的是基于 Transformer 的更现代的神经网络模型。

谷歌翻译历史2020版

虽然 GMNT 对于具有大量可用于训练的数据和文档的特定语言效果非常好,但它在处理较少使用的语言时却遇到了困难。 谷歌的使命是利用机器学习的最新进展并训练更好的模型。

Transformer 代表了对以前神经网络架构的重大改进。 他们使用一种称为自我关注的机制。 它允许模型权衡句子中不同单词相对于彼此的重要性。 这增强了上下文敏感性以及进一步做出准确预测的能力。

Transformers 可以分析整个句子甚至文档,从而更有效地捕捉文本的细微差别和上下文。 因此,他们的翻译更加自然,更接近人类水平的流畅度。

根据谷歌对其基于变压器的翻译系统的研究,这些模型使翻译质量有了显着的提高。 对于可用训练数据较少的语言来说尤其如此。

这就是我们现在的处境。 年复一年,谷歌利用更多数据训练其模型,提高翻译质量,并引入更多语言。

谷歌翻译可用语言

事实上,Google 刚刚宣布他们将在 Google 翻译中添加 110 种新语言。 这是他们一次性添加的最多的一次。 得益于人工智能的力量,这些新的机器学习模型甚至可以比以往更好地处理很少使用的语言,而且在线存在率几乎为零。

谷歌翻译、机器学习和人工智能对翻译的影响

谷歌翻译现在是有史以来最好的。 过去五年机器学习和人工智能的进步在多个方面彻底改变了翻译。

  • 提高准确性——人工智能驱动的模型,特别是那些使用深度学习和神经网络的模型,显着减少了机器翻译曾经容易出现的错误。 通过分析整个句子和更大的上下文,这些模型可以产生更流畅的翻译。
  • 上下文感知——先进的人工智能模型可以更好地理解单词和短语的上下文。 这导致翻译能够捕捉预期含义,而不仅仅是字面的逐字语言转换。 因此,机器翻译感觉更加自然。
  • 实时翻译——机器学习实现了实时翻译功能。 您现在可以积极地用不同的语言进行对话,使环游世界变得更加容易。
  • 语音和图像翻译——人工智能也促进了语音和图像翻译的发展。 用户可以对应用程序说话或将相机对准文本,以立即了解其含义。 我们已经过去了必须手动输入所有内容的日子。
  • 持续改进——人工智能模型旨在随着时间的推移进行学习和改进。 通过每次交互和额外的数据输入,这些系统能够更好地识别模式和细微差别。 随着更多数据集的可用和集成,他们的知识也进一步加深。

谷歌翻译不仅在精度方面有所提高,而且借助人工智能,还引入了一系列新功能,使翻译变得更容易。 它们包括将语言下载到您的手机的功能,这样您即使没有互联网连接也可以使用该服务。

人工智能将带我们走向何方还有待观察。 未来,机器翻译可能与人类输出无法区分。 不过,有一点是肯定的:通过不断改进的历史,谷歌翻译在为人工智能驱动的机器翻译奠定坚实的基础方面发挥了不可或缺的作用。

在您的 WordPress 网站上使用 Google 翻译创造历史

如果您想将 Google 翻译的强大功能引入您的 WordPress 网站,可以使用 TranslatePress 轻松实现。 我们的插件允许您以两种不同的方式将您的网站与其神经机器翻译集成。 它们都非常容易设置。

TranslatePress 多语言

轻松将 Google 翻译与 WordPress 集成,只需点击几下即可将您的网站变成多语言。

获取插件

或下载免费版本

利用 TranslatePress AI 的优势

将 Google 翻译添加到您的网站的第一步是使用 TranslatePress AI。 它会立即自动将您的整个网站转换为另一种语言,并结合使用世界领先的神经机器翻译引擎(包括谷歌翻译)。 此外,所有输入都通过 TranslatePress 自己的人工智能系统进行改进。

另外,设置非常简单。 但请注意,TranslatePress AI 是一项高级功能。

在您的网站上安装 TranslatePress 并激活许可证后,只需转到设置 → TranslatePress 。 在这里,选择您网站的默认语言和您想要提供的目标语言。

选择默认语言和目标语言

当您这样做时,您还可以使用下面的选项来设置语言切换器的样式。 满意后,单击页面底部的“保存更改”

然后,下一步是“自动翻译”选项卡。 在这里,您的第一个任务是将“启用自动翻译”的下拉菜单切换为“是”

打开自动翻译

这开辟了一系列新的选择。

自动翻译选项

TranslatePress AI 是机器翻译的默认设置。 该页面还将显示仍保留为您的信用的字数。

您实际上不需要在这里做任何其他事情,除了查看其他配置选项,最重要的是限制每天翻译的字符的菜单。

完成后,再次保存在底部。 差不多就这样了。 TranslatePress 现在将自动开始翻译您的网站。 当您转到前端并使用语言切换器更改为目标语言时,您可以看到翻译已经存在。

使用 Translatepress ai 翻译的网页

根据需要进行细化

如果你觉得人工智能没有完全掌握你的某个字符串的含义,没问题。 您始终可以手动优化您的网站翻译。

为此,请单击 TranslatePress 设置或 WordPress 任务栏中的翻译网站(它也会显示在网站的前端)。

TranslatePress 中的翻译站点选项

这将带您进入翻译界面。 它的右侧有您网站的预览,左侧有翻译工具。

自动翻译后的translatepress翻译界面

使用预览窗口导航到网站中要进行编辑的部分。 然后,通过下拉菜单、向前和向后箭头或单击预览屏幕中的任何字符串来选择所需的内容。 这样做将在左侧边栏中显示原始字符串及其翻译。

在翻译界面中选择要精炼的字符串

只需编辑翻译的部分,然后保存在顶部(或使用键盘上的Cmd/Ctrl+S )。

正确自动生成的翻译

就是这样。 从现在起,更正后的版本将出现在您的网站上。

直接使用谷歌翻译API

如果您没有 TranslatePress 许可证,或者您特别想使用 Google 翻译来转换您的网站,您也可以这样做。 您所要做的就是返回“设置”→“翻译新闻”→“自动翻译” 。 然后,在Alternative Engines下,选择Google Translate (如果您有许可证,DeepL 也可用)。

切换到谷歌翻译作为翻译引擎

下一步是获取 API 密钥,我们有详细的指南。 或者,使用输入字段下方的链接查找这些说明。

谷歌翻译 API 说明链接的位置

提供API密钥并保存后,返回TranslatePress的翻译界面。 激活谷歌翻译后,每当您在预览窗口中选择一个字符串时,翻译都会立即出现在目标语言的输入字段中。

Translatepress 界面自动翻译

检查其正确性并进行所需的任何更改,然后保存。 完毕。

TranslatePress 的其他有用功能

除了在您的网站上释放 Google 翻译的强大功能外,TranslatePress 还提供翻译图像的可能性。 它发生在相同的界面中,并且与文本的工作方式几乎相同。

在 TranslatePress 中翻译图像

除此之外,通过 TranslatePress 的高级版本,您可以使用以下功能:

  • 多语言 SEO — 使用我们的多语言 SEO 包翻译页面链接、SEO 标题、元描述、ALT 标签和其他重要的 SEO 元素。 它还会自动为您的不同语言创建站点地图,并与大多数流行的 WordPress SEO 插件配合使用。
  • 译者帐户— 如果您决定将网站翻译外包给自由职业者和代理机构,TranslatePress 业务和开发人员许可证允许您为他们创建专用帐户,以便他们可以直接在您的网站上工作。
  • 特定语言的导航– 根据用户选择的语言自动显示不同的菜单。
  • 自动语言检测– 以用户的首选语言提供您的网站,而无需他们手动切换到该语言。

TranslatePress 提供三种不同的定价级别。 免费版本允许您向 WordPress 网站添加一种额外的语言。 下面的定价表提供了更多信息。

2024 年 7 月 TranslatePress 定价表

从谷歌翻译的历史到翻译的未来

多年来,谷歌翻译经历了许多变化。 随着现有技术的发展,它现在比以往任何时候都更加准确。

作为机器翻译的先驱之一,这项服务已经影响了数亿人的生活和商业,且影响深远。 随着谷歌的 Transformer 模型接收越来越多的信息,其翻译将变得更加准确并适用于更多语言。

通过将 TranslatePress AI 集成到您的项目中,您可以在自己的网站上利用 Google Translate 和其他人工智能驱动的翻译服务的强大功能。 轻松翻译您的网站,使其更容易被全球受众访问。 正如您在上面所看到的,只需点击几下即可。