Google翻譯的歷史(2004年至今):詳細分析

已發表: 2024-07-05

機器翻譯工具徹底改變了全球通訊。 它們使世界各地的人們能夠相互交談、聯繫和開展業務。 在這篇文章中,我們想回顧一下一直處於這一變化最前沿的一個解決方案的歷史:Google翻譯。

對許多人來說,谷歌翻譯是線上翻譯工具。 它是免費的、功能強大的,世界各地有數百萬人經常將它用於不同的目的,包括網站翻譯。 多年來,該服務引入了許多創新,使自動翻譯比以往任何時候都更容易使用。 到目前為止,它已成為人工翻譯的有效替代方案。

然而,情況並非總是如此,要達到這一點還有很長的路要走。 為了讓您更了解一路上的發展以及工程師必須克服的障礙,以下我們將介紹Google翻譯迄今為止的歷史。

谷歌翻譯的起源(2004-2016)

儘管Google翻譯於 2006 年正式推出,但其歷史實際上可以追溯到 2004 年。

因此,他幫助創建了谷歌翻譯,該翻譯於 2004 年初上線,只有英語和俄語兩種語言。 此版本的 Google 翻譯基於 SYSTRAN(一種機器翻譯形式)。 即使在當時也是非常不準確的。

漸漸地,Google翻譯接收了更多語言,但進展緩慢。 儘管如此,它仍然能夠翻譯整個網頁,即使只是翻譯成有限的目標語言。

谷歌翻譯歷史的最早版本

該服務於 2006 年 4 月 28 日推出正式測試版 它帶來的一項創新是統計機器翻譯。 它是相關語言學家經過數月的工作和研究而發展出來的。 雖然新系統僅適用於阿拉伯語和英語,但這是向前邁出的一大步。 其他語言很快就開始利用新的現代機器翻譯格式。

谷歌翻譯歷史2006版

與不準確作鬥爭

儘管如此,雖然這個版本的谷歌翻譯在當時是一個巨大的改進和開創性的,但以現代標準來看它相當不准確,並且經常導致令人困惑的亂碼。 主要原因之一是每個輸入首先被翻譯成英語,然後再翻譯成目標語言。 這種兩步翻譯經常會引入錯誤和尷尬的措辭(例如這些糟糕的中文翻譯)。

他媽的蔬菜 糟糕的中文翻譯

此版本的Google翻譯也使用了基於短語的機器翻譯(PBMT)。 這種技術將句子分解成更小的塊或短語,然後單獨翻譯它們,而不是逐字翻譯。 PBMT 使用模式來預測最可能的翻譯。 大大提高了當時機器翻譯的準確性。 然而,儘管該模型接受了數百萬份聯合國和歐洲議會文件的訓練,但它仍然難以適應背景。

直到 2016 年,Google翻譯繼續依賴統計機器翻譯,穩定增加更多語言並改進翻譯。 十多年來,開發團隊和語言學家不斷致力於改進演算法和翻譯準確性。 他們還為該工具添加了一些有用的功能。

結果,Google翻譯變成了一個相當可靠、易於使用的翻譯工具,這是人們迫切需要的。 隨著網路成為人們生活的重要組成部分,向跨越半個地球的其他人交談和銷售已成為常態,人工翻譯已無法跟上。

谷歌翻譯的早期里程碑

在 2016 年進行重大改革之前,Google翻譯經歷了幾個標誌著其發展和擴張的關鍵里程碑。

第一個發布的附加功能是支援單一網頁的翻譯。 2008 年左右,Google翻譯獲得了將其嵌入網站並將內容翻譯成任何語言的能力。 自 2010 年以來,Google Chrome 就能夠自動執行此操作。

2010 年,Google推出了谷歌翻譯 Android 應用程序,一年後又推出了 iOS 應用程式。 這使得不同語言的溝通變得更可行; 您不再需要桌上型電腦。

大約在這個時候,Google翻譯還獲得了文字轉語音等新功能,以顯示您的翻譯如何發音。 它的應用程式甚至可以識別和翻譯圖片中的文字。

谷歌翻譯應用程式即時翻譯範例
圖片來源:Google

然後,在 2014 年,Google收購了 AR 翻譯應用程式 Word Lens,並迅速將其功能整合到Google翻譯及其應用程式中。 Word Lens 更擅長透過圖片辨識文字。 它還支援透過語音輸入進行語音翻譯,使活躍的對話更加流暢。

過渡到神經機器翻譯(2016-2020)

到 2016 年初,Google 已經支援 100 多種語言。 它還引入了一個短語手冊,您可以在其中保存翻譯的短語以供以後進行即時翻譯、更正其輸出的能力以及了解有關您翻譯的單字和短語的更多上下文。

谷歌翻譯歷史2016年更新

但下一個最大的改變已經迫在眉睫。 在慶祝Google翻譯十週年之際,其母公司正在製定重大轉型計劃。 同年 11 月,他們推出了Google神經機器翻譯。

與之前使用的傳統的基於短語的機器翻譯和統計機器翻譯方法不同,這種新方法要優越得多。 它自 2011 年以來一直在製作中。

谷歌翻譯 gnmt 與 pbmt 準確性
圖片來源:Google

神經機器翻譯採用深度學習技術,特別是神經網路。 它處理並翻譯整個句子,而不是像 PBMT 那樣將句子分解成較小的短語。 這種方法更加具有上下文感知能力,因此更加準確和流暢。

NMT 系統接受了大量多語言文字資料集的訓練,學習辨識單字和短語之間的模式和關係。 隨著這個系統接觸到更多的數據,它會學習並變得更加熟練。

另外,GMNT 允許該工具直接翻譯成目標語言,而不是先翻譯成英文。

起初,這種新方法僅適用於英語、法語、德語、西班牙語、葡萄牙語、中文、日語、韓語和土耳其語。 隨著時間的推移,越來越多的語言從中受益,翻譯品質也隨之提高。

這是谷歌翻譯歷史上的一大躍進。 但與持續十多年的統計機器翻譯不同,Google很快就進一步創新。

今日Google翻譯:深度學習與 Transformers(2020 年至今)

到 2020 年,Google已經在機器翻譯領域實現了下一次重大飛躍。 GMNT 開始被淘汰,取而代之的是基於 Transformer 的更現代的神經網路模型。

谷歌翻譯史2020版

雖然 GMNT 對於具有大量可用於訓練的資料和文件的特定語言效果非常好,但它在處理較少使用的語言時卻遇到了困難。 谷歌的使命是利用機器學習的最新進展並訓練更好的模型。

Transformer 代表了對先前神經網路架構的重大改進。 他們使用一種稱為自我關注的機制。 它允許模型權衡句子中不同單字相對於彼此的重要性。 這增強了上下文敏感度以及進一步做出準確預測的能力。

Transformers 可以分析整個句子甚至文檔,從而更有效地捕捉文本的細微差別和上下文。 因此,他們的翻譯更加自然,更接近人類層次的流暢度。

根據谷歌對其基於變壓器的翻譯系統的研究,這些模型使翻譯品質有了顯著的提高。 對於可用訓練資料較少的語言來說尤其如此。

這就是我們現在的處境。 年復一年,Google利用更多資料訓練其模型,提高翻譯質量,並引入更多語言。

谷歌翻譯可用語言

事實上,Google 剛剛宣布他們將在 Google 翻譯中添加 110 種新語言。 這是他們一次性添加的最多的一次。 由於人工智慧的力量,這些新的機器學習模型甚至可以比以往更好地處理很少使用的語言,而且線上存在率幾乎為零。

Google翻譯、機器學習和人工智慧對翻譯的影響

谷歌翻譯現在是有史以來最好的。 過去五年機器學習和人工智慧的進步在多個方面徹底改變了翻譯。

  • 提高準確性-人工智慧驅動的模型,特別是那些使用深度學習和神經網路的模型,顯著減少了機器翻譯曾經容易出現的錯誤。 透過分析整個句子和更大的上下文,這些模型可以產生更流暢的翻譯。
  • 上下文感知——先進的人工智慧模型可以更好地理解單字和短語的上下文。 這導致翻譯能夠捕捉預期含義,而不僅僅是字面的逐字語言轉換。 因此,機器翻譯感覺更加自然。
  • 即時翻譯-機器學習實現了即時翻譯功能。 現在您可以積極地用不同的語言進行對話,使環遊世界變得更加容易。
  • 語音和圖像翻譯—人工智慧也促進了語音和圖像翻譯的發展。 用戶可以對應用程式說話或將相機對準文本,以立即了解其含義。 我們已經過去了必須手動輸入所有內容的日子。
  • 持續改進-人工智慧模型旨在隨著時間的推移進行學習和改進。 透過每次互動和額外的資料輸入,這些系統能夠更好地識別模式和細微差別。 隨著更多資料集的可用和集成,他們的知識也進一步加深。

谷歌翻譯不僅在精確度方面有所提高,而且借助人工智慧,還引入了一系列新功能,使翻譯變得更容易。 它們包括將語言下載到您的手機的功能,因此您即使沒有網路連線也可以使用該服務。

人工智慧將帶我們走向何方還有待觀察。 未來,機器翻譯可能與人類輸出無法區分。 不過,有一點是肯定的:透過不斷改進的歷史,Google翻譯在為人工智慧驅動的機器翻譯奠定堅實的基礎方面發揮了不可或缺的作用。

在您的 WordPress 網站上使用 Google 翻譯創造歷史

如果您想將 Google 翻譯的強大功能引入您的 WordPress 網站,可以使用 TranslatePress 輕鬆實現。 我們的插件可讓您以兩種不同的方式將您的網站與其神經機器翻譯整合。 它們都非常容易設置。

TranslatePress 多語言

輕鬆將 Google 翻譯與 WordPress 集成,只需點擊幾下即可將您的網站變成多語言。

取得插件

或下載免費版本

利用 TranslatePress AI 的優勢

將 Google 翻譯新增至您的網站的第一步是使用 TranslatePress AI。 它會立即自動將您的整個網站轉換為另一種語言,並結合使用世界領先的神經機器翻譯引擎(包括Google翻譯)。 此外,所有輸入都透過 TranslatePress 自己的人工智慧系統進行改進。

另外,設定非常簡單。 但請注意,TranslatePress AI 是一項進階功能。

在您的網站上安裝 TranslatePress 並啟動授權後,只需前往設定 → TranslatePress 。 在這裡,選擇您網站的預設語言和您想要提供的目標語言。

選擇預設語言和目標語言

當您這樣做時,您也可以使用下面的選項來設定語言切換器的樣式。 滿意後,點擊頁面底部的“儲存變更”

然後,下一步是“自動翻譯”選項卡。 在這裡,您的第一個任務是將「啟用自動翻譯」的下拉式選單切換為「是」

開啟自動翻譯

這開啟了一系列新的選擇。

自動翻譯選項

TranslatePress AI 是機器翻譯的預設設定。 該頁面還將顯示仍保留為您的信用的字數。

您實際上不需要在這裡做任何其他事情,除了查看其他配置選項,最重要的是限制每天翻譯的字元的選單。

完成後,再次儲存在底部。 差不多就這樣了。 TranslatePress 現在將自動開始翻譯您的網站。 當您轉到前端並使用語言切換器變更為目標語言時,您可以看到翻譯已經存在。

使用 Translatepress ai 翻譯的網頁

根據需要進行細化

如果你覺得人工智慧沒有完全掌握你的某個字串的意思,沒問題。 您始終可以手動優化您的網站翻譯。

為此,請點擊 TranslatePress 設定或 WordPress 工作列中的翻譯網站(它也會顯示在網站的前端)。

TranslatePress 中的翻譯網站選項

這將帶您進入翻譯介面。 它的右側有您網站的預覽,左側有翻譯工具。

自動翻譯後的translatepress翻譯介面

使用預覽視窗導覽至網站中要進行編輯的部分。 然後,透過下拉式選單、向前和向後箭頭或點擊預覽畫面中的任何字串來選擇所需的內容。 這樣做將在左側邊欄中顯示原始字串及其翻譯。

在翻譯介面中選擇要精煉的字串

只需編輯翻譯的部分,然後儲存在頂部(或使用鍵盤上的Cmd/Ctrl+S )。

正確自動產生的翻譯

就是這樣。 從現在起,更正後的版本將出現在您的網站上。

直接使用谷歌翻譯API

如果您沒有 TranslatePress 許可證,或者您特別想使用 Google 翻譯來轉換您的網站,您也可以這樣做。 您所要做的就是返回“設定”→“翻譯新聞”→“自動翻譯” 。 然後,在Alternative Engines下,選擇Google Translate (如果您有許可證,DeepL 也可用)。

切換到Google翻譯作為翻譯引擎

下一步是取得 API 金鑰,我們有詳細的指南。 或者,使用輸入欄位下方的連結來尋找這些說明。

谷歌翻譯 API 說明連結的位置

提供API金鑰並儲存後,返回TranslatePress的翻譯介面。 啟動Google翻譯後,每當您在預覽視窗中選擇字串時,翻譯都會立即出現在目標語言的輸入欄位中。

Translatepress 介面自動翻譯

檢查其正確性並進行所需的任何更改,然後儲存。 完畢。

TranslatePress 的其他實用功能

除了在您的網站上釋放 Google 翻譯的強大功能外,TranslatePress 還提供翻譯圖像的可能性。 它發生在相同的介面中,並且與文字的工作方式幾乎相同。

在 TranslatePress 中翻譯圖像

除此之外,透過 TranslatePress 的高級版本,您可以使用以下功能:

  • 多語言 SEO — 使用我們的多語言 SEO 套件翻譯頁面連結、SEO 標題、元描述、ALT 標籤和其他重要的 SEO 元素。 它還會自動為您的不同語言建立網站地圖,並與大多數流行的 WordPress SEO 外掛程式配合使用。
  • 譯者帳戶— 如果您決定將網站翻譯外包給自由工作者和代理商,TranslatePress 業務和開發人員授權可讓您為他們建立專用帳戶,以便他們可以直接在您的網站上工作。
  • 特定語言的導覽– 根據使用者選擇的語言自動顯示不同的選單。
  • 自動語言偵測– 以使用者的首選語言提供您的網站,而無需他們手動切換到該語言。

TranslatePress 提供三種不同的定價等級。 免費版本可讓您為 WordPress 網站添加額外的語言。 下面的定價表提供了更多資訊。

2024 年 7 月 TranslatePress 定價表

從谷歌翻譯的歷史到翻譯的未來

多年來,谷歌翻譯經歷了許多變化。 隨著現有技術的發展,它現在比以往任何時候都更加準確。

作為機器翻譯的先驅之一,這項服務已經影響了數億人的生活和商業,而且影響深遠。 隨著Google的 Transformer 模型接收越來越多的信息,其翻譯將變得更加準確並適用於更多語言。

透過將 TranslatePress AI 整合到您的專案中,您可以在自己的網站上利用 Google Translate 和其他人工智慧驅動的翻譯服務的強大功能。 輕鬆翻譯您的網站,使其更容易被全球受眾造訪。 正如您在上面所看到的,只需點擊幾下即可。