История Google Translate (2004 г. – сегодня): подробный анализ
Опубликовано: 2024-07-05Инструменты машинного перевода произвели революцию в глобальной коммуникации. Они позволяют людям по всему миру общаться, общаться и вести бизнес друг с другом. И в этом посте мы хотим взглянуть на историю одного решения, которое постоянно было в авангарде этих изменений: Google Translate.
Для многих Google Translate является инструментом онлайн-перевода. Это бесплатный, мощный инструмент, и миллионы людей по всему миру регулярно используют его для различных целей, включая перевод веб-сайтов. За прошедшие годы в сервисе было реализовано множество инноваций, которые сделали автоматический перевод более доступным, чем когда-либо. На данный момент это действительная альтернатива человеческому переводу.
Однако так было не всегда, и путь к этому был долгим. Чтобы дать вам лучшее представление о развитии событий и препятствиях, с которыми пришлось столкнуться инженерам, ниже мы прольем свет на историю Google Translate до этого момента.
Происхождение Google Translate (2004–2016 гг.)
Хотя Google Translate официально был запущен в 2006 году, его история на самом деле уходит корнями в 2004 год. Соучредитель Google Сергей Брин, родившийся в России, был разочарован инструментами машинного перевода того времени.
Как следствие, он помог создать Google Translate, который был запущен в начале 2004 года только с двумя языками: английским и русским. Эта версия Google Translate основана на SYSTRAN — форме машинного перевода. Это было очень неточно даже в то время.
Постепенно в Google Translate появилось больше языков, но дела шли медленно. Тем не менее, он мог переводить целые веб-страницы, хотя бы на ограниченное количество целевых языков.
Бета-версия сервиса была запущена 28 апреля 2006 года. Одним из нововведений стал статистический машинный перевод. Он был разработан после нескольких месяцев работы и исследований участвовавших в нем лингвистов. Хотя новая система была доступна только для арабского и английского языков, это был большой шаг вперед. Вскоре другие языки начали использовать преимущества нового современного формата машинного перевода.
Борьба с неточностью
Тем не менее, хотя эта версия Google Translate была значительным улучшением и новаторством в то время, она была довольно неточной по современным стандартам и часто приводила к запутанной тарабарщине. Одной из основных причин этого был тот факт, что все материалы сначала переводились на английский и только потом на целевой язык. Этот двухэтапный перевод часто содержал ошибки и неуклюжие формулировки (как, например, в этих плохих китайских переводах).
В этой версии Google Translate также использовался машинный перевод на основе фраз (PBMT). Этот метод разбивает предложения на более мелкие фрагменты или фразы и переводит их индивидуально, а не пословно. PBMT использует шаблоны для прогнозирования наиболее вероятных переводов. В то время это значительно повысило точность машинного перевода. Тем не менее, несмотря на то, что модель была обучена на миллионах документов Организации Объединенных Наций и Европейского парламента, ей все еще не хватало контекста.
Google Translate продолжал полагаться на статистический машинный перевод до 2016 года, постепенно добавляя новые языки и улучшая переводы. Более десяти лет команда разработчиков и лингвисты непрерывно работали над совершенствованием алгоритмов и точностью перевода. Они также добавили в инструмент несколько полезных функций.
В результате Google Translate превратился в достаточно надежный и доступный инструмент перевода, который был крайне необходим. Поскольку Интернет стал основным продуктом жизни людей, а общение и продажа другим людям на другом конце земного шара стало нормой, переводчики-люди больше не могли успевать за ними.
Ранние этапы Google Translate
Перед масштабной реорганизацией в 2016 году Google Translate преодолел несколько ключевых вех, ознаменовавших его развитие и расширение.
Одной из первых выпущенных дополнительных функций была поддержка перевода отдельных веб-страниц. Примерно в 2008 году Google Translate получил возможность встраивать его в веб-сайт и переводить контент на любой язык. С 2010 года Google Chrome может делать это автоматически.
В 2010 году Google представила приложение Google Translate для Android, а год спустя — приложение для iOS. Это сделало общение на разных языках еще более возможным; для этого вам больше не нужен настольный компьютер.
Примерно в это же время Google Translate также получил новые функции, такие как преобразование текста в речь, которые показывают, как произносится ваш перевод. Его приложение могло даже распознавать и переводить слова на картинках.
Затем, в 2014 году, Google приобрела Word Lens, приложение для перевода AR, и быстро интегрировала его функции в Google Translate и свое приложение. Word Lens еще лучше распознавал текст по изображениям. Он также поддерживал перевод речи посредством голосового ввода, что делало активные разговоры еще более плавными.
Переход на нейромашинный перевод (2016-2020)
К началу 2016 года Google уже поддерживал более 100 языков. Он также представил разговорник, в котором вы могли сохранять переведенные фразы для последующего использования, мгновенный перевод, возможность корректировать вывод и узнавать больше контекста о словах и фразах, которые вы переводите.
Но следующее самое большое изменение уже было рядом. Отмечая десятую годовщину Google Translate, его материнская компания строила большие планы по трансформационному сдвигу. В ноябре того же года они представили Google Neural Machine Translation.
В отличие от традиционных методов машинного перевода на основе фраз и статистического машинного перевода, которые они использовали раньше, этот новый метод оказался намного лучше. Он находился в разработке с 2011 года.
Нейронный машинный перевод использует методы глубокого обучения, в частности нейронные сети. Он обрабатывает и переводит целые предложения, а не разбивает их на более мелкие фразы, как PBMT. Этот подход гораздо более контекстно-зависим и, следовательно, более точен и свободен.
Системы NMT обучаются на обширных наборах данных многоязычного текста, учатся распознавать закономерности и связи между словами и фразами. И по мере того, как эта система получает больше данных, она учится и становится еще более опытной.
Кроме того, GMNT позволил инструменту переводить непосредственно на целевой язык, а не сначала переводить на английский.
Сначала этот новый подход был доступен только для английского, французского, немецкого, испанского, португальского, китайского, японского, корейского и турецкого языков. Со временем все больше и больше языков стали получать от этого выгоду, и качество перевода резко возросло.
Это был большой шаг вперед в истории Google Translate. Но в отличие от статистического машинного перевода, который длился более десяти лет, Google быстро внедрил инновации.
Google Translate сегодня: глубокое обучение и трансформеры (с 2020 г. по настоящее время)
К 2020 году Google уже совершила следующий большой шаг в области машинного перевода. GMNT начали постепенно выводить из эксплуатации и заменять более современной моделью нейронной сети, основанной на трансформаторах.
Хотя GMNT очень хорошо работал для отдельных языков, по которым было доступно много данных и документов для обучения, у него были проблемы с менее используемыми языками. Google поставил перед собой задачу воспользоваться последними достижениями в области машинного обучения и разработать еще лучшую модель.
Трансформаторы представляют собой существенное улучшение по сравнению с предыдущими архитектурами нейронных сетей. Они используют механизм, называемый самовниманием. Это позволяет модели взвешивать важность разных слов в предложении относительно друг друга. Это еще больше повышает контекстную чувствительность и возможность делать точные прогнозы.
Трансформеры могут анализировать целое предложение или даже документ таким образом, чтобы более эффективно улавливать нюансы и контекст текста. Как следствие, их переводы гораздо более естественны и близки к беглости человеческого языка.
Согласно исследованию Google, посвященному их системе перевода на основе преобразователя, эти модели привели к существенному повышению качества перевода. Это особенно актуально для языков с меньшим количеством доступных обучающих данных.
И вот где мы находимся сейчас. Год за годом Google тренирует свою модель на большем количестве данных, улучшая качество переводов и добавляя дополнительные языки.
Фактически, Google только что объявил, что они включают в Google Translate 110 новых языков. Это максимум, что они когда-либо добавляли сразу. Благодаря возможностям искусственного интеллекта эти новые модели машинного обучения могут обрабатывать даже редко используемые языки при почти нулевом присутствии в Интернете, намного лучше, чем когда-либо прежде.
Влияние Google Translate, машинного обучения и искусственного интеллекта на перевод
Google Translate теперь лучший из всех, что когда-либо были. Достижения в области машинного обучения и искусственного интеллекта за последние пять лет произвели революцию в переводе по нескольким направлениям.
- Повышенная точность . Модели на основе искусственного интеллекта, особенно те, которые используют глубокое обучение и нейронные сети, значительно снизили количество ошибок, которым когда-то были подвержены машинные переводы. Анализируя целые предложения и более обширные контексты, эти модели обеспечивают более плавный перевод.
- Осведомленность о контексте . Усовершенствованные модели искусственного интеллекта могут лучше понимать контекст слов и фраз. Это приводит к переводам, которые передают предполагаемый смысл, а не просто к буквальному дословному преобразованию языка. В результате машинный перевод кажется более естественным.
- Перевод в реальном времени . Машинное обучение позволило реализовать возможности перевода в реальном времени. Теперь вы можете активно общаться на разных языках, что делает путешествия по миру намного доступнее.
- Перевод голоса и изображений . Искусственный интеллект также способствовал развитию перевода голоса и изображений. Пользователи могут говорить в приложении или наводить камеру на текст, чтобы мгновенно узнать его значение. Мы уже давно прошли те времена, когда приходилось вводить все вручную.
- Постоянное совершенствование . Модели искусственного интеллекта предназначены для обучения и совершенствования с течением времени. С каждым взаимодействием и вводом дополнительных данных эти системы лучше распознают закономерности и нюансы. И по мере того, как все больше наборов данных становятся доступными и интегрированными, их знания углубляются.
Google Translate не только улучшил точность, но и благодаря искусственному интеллекту представил ряд новых функций, которые делают перевод более доступным. Они включают в себя возможность загружать языки на ваш телефон, чтобы вы могли пользоваться услугой даже без подключения к Интернету.
Еще неизвестно, куда нас приведет ИИ. В будущем машинные переводы могут стать неотличимыми от результатов человеческого труда. Однако одно можно сказать наверняка: благодаря своей истории постоянного совершенствования Google Translate сыграл важную роль в создании прочной основы для машинного перевода на базе искусственного интеллекта.
Создайте историю с помощью Google Translate на своем веб-сайте WordPress
Если вы хотите использовать возможности Google Translate на своем веб-сайте WordPress, вы можете легко сделать это с помощью TranslatePress. Наш плагин позволяет вам интегрировать ваш веб-сайт с нейронным машинным переводом двумя разными способами. Оба они очень просты в настройке.
TranslatePress Многоязычный
Легко интегрируйте Google Translate с WordPress и сделайте свой сайт многоязычным за несколько кликов.
Получить плагинИли скачайте БЕСПЛАТНУЮ версию
Воспользуйтесь преимуществами TranslatePress AI
Первый шаг к добавлению Google Translate на ваш сайт — использовать TranslatePress AI. Он мгновенно автоматически преобразует весь ваш веб-сайт на другой язык и использует комбинацию ведущих мировых механизмов нейронного машинного перевода, включая Google Translate. Кроме того, все данные передаются для доработки через собственные системы искусственного интеллекта TranslatePress.
Плюс настройки минимальны. Однако имейте в виду, что TranslatePress AI — это премиум-функция.
После установки TranslatePress на свой сайт и активации лицензии просто перейдите в «Настройки» → «TranslatePress» . Здесь выберите язык вашего веб-сайта по умолчанию и целевой язык (языки), на которых вы хотите его предлагать.
Пока вы этим занимаетесь, вы также можете использовать параметры для стилизации переключателя языка, приведенные ниже. Если все устраивает, нажмите «Сохранить изменения» внизу страницы.
Затем ваш следующий шаг — вкладка «Автоматический перевод» . Здесь ваша первая задача — переключить раскрывающееся меню для параметра «Включить автоматический перевод» на «Да» .
Это открывает ряд новых возможностей.
TranslatePress AI является настройкой по умолчанию для машинного перевода. На странице также будет показано количество слов, оставшихся в вашем кредите.
На самом деле вам больше ничего здесь делать не нужно, кроме, возможно, проверки других параметров конфигурации, наиболее важно меню для ограничения количества переводимых символов в день.
После этого снова сохраните внизу. Вот и все. TranslatePress теперь автоматически начнет перевод вашего веб-сайта. Когда вы зайдете во внешний интерфейс и воспользуетесь переключателем языка, чтобы переключиться на целевой язык, вы увидите, что переводы уже присутствуют.
Уточняйте по мере необходимости
Если вы чувствуете, что ИИ не полностью уловил значение одной из ваших строк, не проблема. Вы всегда можете уточнить перевод вашего сайта вручную.
Для этого нажмите «Перевести сайт» в настройках TranslatePress или на панели задач WordPress (она также отображается в передней части вашего сайта).
Вы попадете в интерфейс перевода. Справа имеется предварительный просмотр вашего сайта, а слева — инструменты перевода.
Используйте окно предварительного просмотра, чтобы перейти к той части вашего веб-сайта, где вы хотите внести изменения. Затем выберите желаемый контент с помощью раскрывающегося меню, стрелок вперед и назад или щелкнув любую строку на экране предварительного просмотра. При этом на левой боковой панели отобразится как исходная строка, так и ее перевод.
Просто отредактируйте переведенную часть, затем сохраните ее вверху (или используйте Cmd/Ctrl+S на клавиатуре).
Вот и все. Отныне исправленная версия будет появляться на вашем сайте.
Используйте Google Translate API напрямую
Если у вас нет лицензии TranslatePress или вы специально хотите использовать Google Translate для конвертации своего сайта, вы также можете это сделать. Все, что вам нужно сделать, это вернуться в «Настройки» → «TranslatePress» → «Автоматические переводы» . Затем в разделе «Альтернативные движки» выберите Google Translate (если у вас есть лицензия, DeepL также доступен).
Следующим шагом будет получение ключа API, для которого у нас есть подробное руководство. Либо воспользуйтесь ссылкой под полем ввода, чтобы найти эти инструкции.
После предоставления ключа API и сохранения вернитесь к интерфейсу перевода TranslatePress. При активированном Google Translate всякий раз, когда вы выбираете строку в окне предварительного просмотра, перевод должен немедленно появляться в поле ввода для целевого языка.
Проверьте его правильность и внесите необходимые изменения, затем сохраните. Сделанный.
Другие полезные функции TranslatePress
Помимо раскрытия возможностей Google Translate на вашем веб-сайте, TranslatePress дополнительно предлагает возможность переводить ваши изображения. Это происходит в том же интерфейсе и работает почти так же, как и для текста.
Кроме того, с премиум-версией TranslatePress вы получаете доступ к следующим функциям:
- Многоязычное SEO . Переведите ссылки страниц, SEO-заголовки, метаописания, ALT-теги и другие важные элементы SEO с помощью нашего многоязычного пакета SEO. Он также автоматически создает карты сайта для разных языков и работает с большинством популярных плагинов WordPress SEO.
- Учетные записи переводчиков . Если вы решите поручить перевод вашего веб-сайта фрилансерам и агентствам, лицензии TranslatePress Business и Developer позволяют вам создавать для них специальные учетные записи, чтобы они могли работать непосредственно на вашем веб-сайте.
- Навигация с учетом языка — автоматически отображает различные меню в зависимости от языка, выбранного пользователем.
- Автоматическое определение языка . Предлагайте свой сайт на предпочитаемом пользователем языке без необходимости переключаться на него вручную.
TranslatePress предлагает три разных ценовых уровня. Бесплатная версия позволяет вам добавить еще один язык на ваш сайт WordPress. В таблице цен ниже представлена дополнительная информация.
От истории Google Translate к будущему перевода
Google Translate за прошедшие годы претерпел множество изменений. Развиваясь вместе с доступными технологиями, теперь он стал более точным, чем когда-либо.
Будучи одним из предшественников машинного перевода, этот сервис повлиял на жизнь и бизнес сотен миллионов людей, и конца этому не видно. Поскольку модели-трансформеры Google будут поглощать все больше и больше информации, их переводы станут еще более точными и применимыми к еще большему количеству языков.
Интегрировав TranslatePress AI в свои проекты, вы сможете использовать возможности Google Translate и других служб перевода на базе искусственного интеллекта на своем собственном веб-сайте. Легко переведите свой сайт и сделайте его более доступным для глобальной аудитории. Как вы видели выше, это займет всего несколько кликов.