Google Translate переходит на новую нейронную сеть


Google сделал рекордно точную систему машинного перевода на основе нейросетей

Eduardo Woo / Flickr

Специалисты по искусственному интеллекту из Google представили новую систему машинного перевода, которая основана на принципах глубинного обучения. По формальным оценкам и по мнению опрошенных добровольцев, точность перевода системой существенно выше, чем у существующих аналогов, хотя и не достигает пока точности живых переводчиков. Описание системы выложено в виде препринта в базе arXive.org.

Точный машинный перевод с одного языка на другой является одной из классических задач в области искусственного интеллекта. Пока существующие системы не способны конкурировать с живыми переводчиками, однако быстро их догоняют. За последние годы точность перевода существенно выросла за счет применения продвинутых методов машинного обучения, развития параллельного вычисления на графических процессорах и появления большого количества баз данных с текстами на разных языках, которые могут служить в качестве обучающей выборки.

Популярные системы машинного перевода можно грубо разделить на традиционные, основанные на переводе отдельных фраз, и на более новые, основанные на нейронных сетях, учитывающих не только типичное значение фразы, но и ее контекст. Нейронные сети, которые используются в этом последнем случае, чаще всего относятся к классу рекуррентных, их основным отличием является то, что их ответ зависит не только от поступающих на вход данных, но и от предыдущего состояния сети. Это позволяет системам «помнить» о том, что они «видели» раньше, и учитывать это при выборе того или иного ответа. Грубо говоря, именно это позволяет системе понимать, что при переводе фразы «тугой лук» второе слово не следует трактовать как onion — на это намекает первое слово исходной фразы, которое должно изменить состояние нейросети. При этом программисты не обязаны заранее указывать или даже знать правила сочетаемости слов друг с другом, этому нейросеть учится самостоятельно на базе готовых текстов.

Архитектура системы: слева анализирующая, справа синтезирующая нейросеть. Посередине показан модуль внимания. Слова в исходном предложении показаны x, в переводном — y. Каждый розовый или оранжевый бокс отражает состояние вектора состояния в слое.

«Google Переводчик» на основе нейросетей теперь работает без интернета

У переводчика Google есть крайне удобная функция, когда вы направляете камеру смартфона на неизвестное слово или выражение и машина выдает вам перевод с «басурманского» на родной язык. Однако до недавнего времени столь полезную в путешествиях штуку можно было использовать лишь при наличии подключения к интернету, что в виду наличия роуминга не всегда дешево. Однако представители Google заявили о выходе мобильного приложения, которое будет использовать функцию нейросетевого перевода без необходимости выхода в Сеть.

Стоит заметить, что Google не первая корпорация, которая провернула подобное. Мы уже рассказывали вам о том, как Microsoft выпустила офлайновый нейросетевой переводчик. Однако для нас с вами это означает лишь то, что компании будут конкурировать между собой, что заставит их улучшать свои продукты, и в итоге выиграют конечные пользователи. Уже завтра, 15 июня, по заверению Google, функция нейросетевого перевода будет доступна всем пользователям приложений-переводчиков для Android и iOS. Разработчики заявляют о поддержке 59 языковых пакетов, каждый из которых, скорее всего, нужно будет устанавливать отдельно. Размер одного языкового пакета будет составлять порядка 35 мегабайт.

В целом на данном этапе творение программистов Google выглядит более привлекательно, чем продукция Microsoft: языковые пакеты весят меньше, у Google заявлена поддержка даже самых бюджетных моделей (у Microsoft, напомним, требуется наличие специального чипа). Помимо этого, Google вырывается вперед и по количеству поддерживаемых языков – 59 против 11. В любом случае победителя покажет время, нам же с вами остается радоваться тому, что нейросетевые вычисления становятся тем, чем и должны – продуктами, улучшающими нашу жизнь.

Как работает Google Переводчик после внедрения нейронных сетей

Всем известно, что текст, переведенный с помощью компьютерных программ можно с легкостью отличить от перевода человека. И Google Translate практически ни чем в этом не отличался от других программ. Такие переводы часто страдают неправильным смыслом, неверно подобранными словами и другими причудами. Все это породило в интернете множество шуток.

Но это остается в прошлом, потому нейронные сети добрались и до Google Translate. Еще в ноябре прошлого года компания начала тестировать новую технологию для переводов в нескольких странах. Суть машинного нейронного перевода заключается в том, что переводиться не фразы и слова отдельно, а все предложение целиком.

Нейросеть GNMT (Google Neural Machine Translation) составила единую базу смыслов человеческих слов. Благодаря этому переводчик может работать с языковыми парами, которым его не обучали.

Для таких переводов нейросеть оперирует данными схожих языковых пар. К примеру, обучив нейросеть языковой паре «японский-английский» и «корейский-английский», она сможет без труда качественно перевести текст в паре «японский-корейский».

Переводы на основе нейросетей уже работают для восьми основных языков мира, а недавно к ним присоединились хинди, вьетнамский и русский.

Визуальный перевод Google Translate тоже перешел на нейронные технологии и получил поддержку 13 новых языков

Поделитесь в соцсетях:

На днях компания Google приступила к распространению обновления мобильного приложения Google Translate для iOS и Android. Оно добавляет для функции мгновенного визуального перевода поддержку 13 новых языков, включая арабский, бенгальский, хинди, тайский и вьетнамский. Об этом представители компании рассказали ресурсу VentureBeat.

Топ-пост этого месяца:  Предварительная загрузка шрифтов – отличный способ ускорить страницу

Визуальный перевод посредством камеры смартфона появился в переводчике Google Translate еще в 2015 году и изначально поддерживался для 27 разных языков. С его помощью пользователи могут переводит уличные знаки, вывески, меню и другие надписи в режиме реального времени. Единственное, что функция требует для своей работы подключения к сети.

С этим обновлением, которое, как обычно, будет распространяться поэтапно, Google довела общее количество языков, для которых доступен визуальный перевод почти до 50 штук.

По данным Babbel, арабский, бенгальский, хинди и панджаби входят в десятку самых популярных языков в мире.


Обучение визуального Google Translate новым языкам проходило с использованием Google Cloud Vision API.

Также стоит отметить, что функция визуального перевода Google Translate тоже перешла на нейронные технологии – систему Google Neural Machine Translation (GNMT), основанную на нейронных сетях и принципах глубинного обучения. Напомним, GNMT, дебютировавшая в конце 2020 года изначально была доступна только для переводов онлайн и лишь недавно заработала для офлайн-переводов.

Google удалось подключить нейросеть к сервису переводов

Google преодолела технологические проблемы и подключила к нейросети свой сервис переводов Google Translate. Это позволило сразу же сократить количество ошибок в переводах — в паре китайский-английский число неточностей уже уменьшилось на 60%. А все потому, что новая система GNMT воспринимает предложение как единое целое, а не как серию разрозненных слов и словосочетаний.

Алгоритмы и глубокое машинное обучение Google Translate использовал и ранее, но системы были далеки от совершенства и применялись лишь в отдельных случаях — например, для перевода официальных документов. Теперь нейросеть Google Neural Machine Translation (GNMT) стала доступна всем пользователям сервиса, правда пока только при переводе с китайского на английский язык. Этот сегмент пользуется большой популярностью — ежедневно через программу проходят 18 млн переводов.
Со временем Google обещает добавить поддержку всех 10 000 языковых пар, которые на данный момент доступны в Google Translate.

Как отмечают представители Google, нейросеть GNMT работает настолько точно, что теперь машинный перевод практически не отличается от перевода, выполненного профессионалом. Раньше Google Translate переводила отдельные слова и фразы в предложениях, а теперь алгоритм смотрит на текст как на единое целое. В основе системы лежит долгая краткосрочная память (LSTM), которая напоминает по своему принципу работы память у человека. Благодаря LSTM программа может переводить конец предложения и помнить при этом, что было в начале.

Эта технология была известна и раньше, но скорость ее работы оставляла желать лучшего. Google удалось ускорить процесс за счет использования интегральных схем Tensor Processing Unit (TPU), созданных специально для машинного обучения.
GNMT интеллектуально анализирует предложения и делит их на смысловые словарные сегменты. Во многом этот процесс напоминает распознавание изображений по отдельным пикселям.

При переводе с китайского на английский количество ошибок в переводе сократилось на 60%, и это не предел. В Google отмечают, что в некоторых случаях машинный перевод по точности сопоставим с работой, выполненной человеком. Испытать работу системы можно уже сегодня — достаточно попробовать перевести что-либо с китайского на английский язык.

В блоге Google подчеркивается, что GNMT пока далека от совершенства — она все еще может пропускать слова и неверно переводить имена и редкие термины, а также воспринимать предложения в отрыве от контекста. Тем не менее, разработка Google указывает на очевидные преимущества нейронного перевода перед традиционным машинным.

Нейросети становятся все ближе к пользователям. Недавно приложение SwiftKey на Android стало использовать нейронные сети для большей точности предикативного набора. Система воспринимает слова как часть кода и предлагает наиболее подходящие варианты для его завершения. Нейросети также используются для распознавания изображений лиц по воспоминаниям, определения возраста человека по анализу крови, имитации звуков и речи.

Google удалось подключить нейросеть к сервису переводов

Google преодолела технологические проблемы и подключила к нейросети свой сервис переводов Google Translate. Это позволило сразу же сократить количество ошибок в переводах — в паре китайский-английский число неточностей уже уменьшилось на 60%. А все потому, что новая система GNMT воспринимает предложение как единое целое, а не как серию разрозненных слов и словосочетаний.

Алгоритмы и глубокое машинное обучение Google Translate использовал и ранее, но системы были далеки от совершенства и применялись лишь в отдельных случаях — например, для перевода официальных документов. Теперь нейросеть Google Neural Machine Translation (GNMT) стала доступна всем пользователям сервиса, правда пока только при переводе с китайского на английский язык. Этот сегмент пользуется большой популярностью — ежедневно через программу проходят 18 млн переводов.

Как отмечают представители Google, нейросеть GNMT работает настолько точно, что теперь машинный перевод практически не отличается от перевода, выполненного профессионалом. Раньше Google Translate переводила отдельные слова и фразы в предложениях, а теперь алгоритм смотрит на текст как на единое целое. В основе системы лежит долгая краткосрочная память (LSTM), которая напоминает по своему принципу работы память у человека. Благодаря LSTM программа может переводить конец предложения и помнить при этом, что было в начале.

Нейронный перевод в мобильном «Google Переводчике» теперь работает без интернета

Умный офлайн-перевод поддерживает 59 языков, в том числе русский.

«Google Переводчик» для iOS и Android теперь поддерживает нейронный машинный перевод без доступа к Сети. Благодаря этому приложение без интернета переводит предложения гораздо качественнее.

Нейронный офлайн-перевод работает на 59 языках. Среди них — русский, белорусский и украинский. Каждый языковой пакет занимает на устройстве от 30 до 40 Мбайт.

Топ-пост этого месяца:  Государство будет контролировать отечественный интернет вещей

Сейчас нововведение доступно небольшому числу пользователей. До всех оно доберётся в ближайшее время.

Раньше «Google Переводчик» работал в офлайн-режиме по фразовому принципу. Из-за этого перевод зачастую получался неестественным и малопонятным.

Google переводит Google Translate на нейронные сети

Компания Google начала тестировать новую версию сервиса Google Translate под названием Google Machine Translation Neural. Как понятно из названия, он использует нейронные сети и допускает на 55-85% меньше ошибок.


Десять лет назад мы объявили о запуске сервиса Google Translate, использующего в качестве ключевого алгоритма статистический машинный перевод. С тех пор стремительное развитие машинного интеллекта усовершенствовало распознавание изображений и речи, но улучшение машинного перевода остается сложной задачей. Сегодня мы анонсируем систему Google Machine Translation Neura (GNMT), которая использует новейшие методы обучения, призванные существенно повысить уровень машинного перевода

Работа обычного алгоритма статистического машинного перевода (PBMT) выглядит так: предложение разбивается на слова и фразы, а затем переводит их независимо друг от друга. Из-за этого в результате часто получается набор бессвязных слов, поскольку многие значения слов зависят от контекста. Система же GNMT рассматривает как единицу для перевода всё предложение в целом, учитывая контекст и ассоциативные связи. Это возможно благодаря технологии нейронных LSTM-сетей: одна из них анализирует предложение на языке ввода, а другая — генерирует его на нужном языке.

Конечно, пока что система допускает ошибки в сложных случаях — при переводе редко употребляемых слов, имён и названий. Однако в целом количество ошибок снизилось на 60%. Новая версия уже работает на английско-китайской версии мобильного приложения, в ближайшие месяцы перечень будет расширен.

Google Translate начал использовать нейросети для перевода предложений

Компания Google в последнее время переводит все свои сервисы на нейронные сети, что открывает новые возможности и позволяет им самостоятельно совершенствоваться со временем. Очередь дошла и до фирменного переводчика Google Translate, который благодаря современным технологиям научился переводить целые предложения. Ранее сервис переводил отдельные слова и фразы, поэтому смысл предложения зачастую терялся. С внедрением технологии нейронного машинного перевода Google Translate анализирует предложение целиком, чтобы понять его контекст и предложить максимально точный перевод.

На данный момент перевод с помощью нейронных сетей работает только на восьми языках: английском, французском, немецком, испанском, португальском, китайском, японском, корейском и турецком. В планах Google — реализовать поддержку всех языков, которые сейчас доступны в сервисе.

Google Переводчик

Google LLC

Уже скачали: 25996 пользователей

63 комментария

достаточно зайти на русский али, чтобы понять, как работают эти нейросети )

trogorod,
там не Google переводчик, там китайцы вручную переводят. Вместо нейросетей — барак и десять человек в одной комнате.

Grigor778,
10 человек в одной комнате сразу после брака? Ох уж эти китайцы.

Yuri_Berezin,
Это птица

amatsuki,
датуте и датвидания

amatsuki,
Это рекордсмен

trogorod,
это чешки

Grigor778,
при помощи Google Translate, с русского на английский а потом на китайский, итог видим на али.

P.S. руки оторвать!

Dogii,
По самые ноги!

И обратно прикрутить. Вдруг.


Grigor778,
Так это и есть нейросеть. В самом что ни на есть натуральном смысле)

trogorod,
Вы даже читать не умеете , а все туда же)) в нейросетях поддержки русского нет еще))))

Gagarinbd,
Потому что у русских есть водка — лучший переводчик, и подключение к интернету не требуется!

Так обладая интеллектом чуть выше среднего уже на этапе становления машинных переводчиков можно было вполне себе достоверно переводить, а это было десятки лет назад. Но перевод с любого на любой по прежнему оставляет желать лучшего, всё что привнесли нейросети это значительно превосходящую по скорости обработку баз данных в реальным времени, что сокращает скорость подбора слов, но это пока никак не влияет на качество перевода. Ибо использовались ровно такие же базы данные, другое дело что со временем могут быть подключены новые, но сам принцип работы не изменился.

4pdaUL,
принцип работы как раз изменился в корне и в контексте ) давайте дождемся все же релиза русского языка , а потом будем рассуждать как и кто на али переводит текст(собственно ведь этот коммент мы осуждаем от гражданина trogorod, ) ) даже следуя вашей логике машинный перевод может нормально переводить если правильно строить фразы, а гугл лишь инструмент, шаблон если хотите, ( дай человеку молоток он забьет гвоздь, дай обезьяне она будет им махать и спину чесать) но я склоняюсь к тому, что нужно подождать все же русского, и тогда с вами подискутируем, лучше стало переводить или хуже, учится сам переводчик понимать контекст или ничего не изменилось )

это все, или еще кто-то?

Очень полезное нововведение, т.к. иногда гугл переводчик несет такую ахинею.

HappyMadMan,
Когда-то гугл переводил очень круто, но потом они ввели функцию «Предложить перевод».

теперь Яндекс переводит лучше Гугла.

HappyMadMan, Duck and Cover — утка и крышка

Охладите трахание не будет?

sini4ka_in_a_vacuum,
Мои ноги хорошо и денди

sini4ka_in_a_vacuum,
Так углепластик, я рассматриваю ее пользу.

Google Translate переходит на новую нейронную сеть

Дельта принтеры крайне требовательны к точности изготовления комплектующих (геометрия рамы, длины диагоналей, люфтам соединения диагоналей, эффектора и кареток) и всей геометрии принтера. Так же, если концевые выключатели (EndStop) расположены на разной высоте (или разный момент срабатывания в случае контактных концевиков), то высота по каждой из осей оказывается разная и мы получаем наклонную плоскость не совпадающая с плоскостью рабочего столика(стекла). Данные неточности могут быть исправлены либо механически (путем регулировки концевых выключателей по высоте), либо программно. Мы используем программный способ калибровки.
Далее будут рассмотрены основные настройки дельта принтера.
Для управления и настройки принтера мы используем программу Pronterface.
Калибровка принтера делится на три этапа:

Топ-пост этого месяца:  Рассылка писем на сервисе SmartResponder
1 Этап. Корректируем плоскость по трем точкам

Выставление в одну плоскость трех точек — A, B, C (расположенных рядом с тремя направляющими). По сути необходимо уточнить высоту от плоскости до концевых выключателей для каждой из осей.
Большинство (если не все) платы для управления трехмерным принтером (В нашем случае RAMPS 1.4) работают в декартовой системе координат, другими словами есть привод на оси: X, Y, Z.
В дельта принтере необходимо перейти от декартовых координат к полярным. Поэтому условимся, что подключенные к двигателям X, Y, Z соответствует осям A, B, C.(Против часовой стрелки начиная с любого двигателя, в нашем случае смотря на логотип слева — X-A, справа Y-B, дальний Z-C) Далее при слайсинге, печати и управлении принтером в ручном режиме, мы будем оперировать классической декартовой системой координат, электроника принтера сама будет пересчитывать данные в нужную ей систему. Это условность нам необходима для понятия принципа работы и непосредственной калибровки принтера.

Точки, по которым мы будем производить калибровку назовем аналогично (A, B, C) и позиция этих точек равна A= X-52 Y-30; B= X+52 Y-30; C= X0 Y60.

Алгоритм настройки:

    Подключаемся к принтеру. (В случае “крагозяб” в командной строке, необходимо сменить скорость COM порта. В нашем случае с 115200 на 250000 и переподключится)

После чего мы увидим все настройки принтера.


  • Обнуляем высоты осей X, Y, Z командой M666 x0 y0 z0.
    И сохраняем изменения командой M500. После каждого изменения настроек необходимо нажать home (или команда g28), для того что бы принтер знал откуда брать отсчет.
  • Калибровка принтера производится “на горячую”, то есть должен быть включен подогрев стола (если имеется) и нагрев печатающей головки (HotEnd’а) (Стол 60град., сопло 185 град.) Так же нам понадобится щуп, желательно металлический, известных размеров. Для этих задач вполне подойдет шестигранный ключ (самый большой, в нашем случае 8мм, он предоставляется в комплекте с принтерами Prizm Pro и Prizm Mini)
  • Опускаем печатающую головку на высоту (условно) 9мм (от стола, так, что бы сопло еле касалось нашего щупа, т.к. высота пока что не точно выставлена.) Команда: G1 Z9.
  • Теперь приступаем непосредственно к настройке наших трех точек.
    Для удобства можно вместо g- команд создать в Pronterface четыре кнопки, для перемещения печатающей головки в точки A, B, C, 0-ноль.

  • Последовательно перемещаясь между тремя точками (созданными ранее кнопками или командами) выясняем какая из них находится ниже всего (визуально) и принимает эту ось за нулевую, относительно нее мы будем менять высоту остальных двух точек.
  • Предположим, что точка A у нас ниже остальных. Перемещаем головку в точку B(Y) и клавишами управления высотой в Pronterface опускаем сопло до касания с нашим щупом, считая величину, на которую мы опустили сопло (в лоб считаем количество нажатий на кнопки +1 и +0.1)
    Далее командой меняем параметры высоты оси Y: M666 Y <посчитанная величина>
    M666 Y0.75
    M500
    G28
  • Ту же операцию проделываем с оставшимися осями. После чего следует опять проверить высоту всех точек, может получится, что разброс высот после первой калибровки уменьшится, но высота все равно будет отличатся, при этом самая низкая точка может изменится. В этом случае повторяем пункты 6-7.
  • 2 Этап. Исправляем линзу

    После того как мы выставили три точки в одну плоскость необходимо произвести коррекцию высоты центральной точки. Из за особенности механики дельты при перемещении печатающей головки между крайними точками в центре она может пройти либо ниже либо выше нашей плоскости, тем самым мы получаем не плоскость а линзу, либо вогнутую либо выпуклую.

    Корректируется этот параметр т.н. дельта радиусом, который подбирается экспериментально.

    Калибровка:

    1. Отправляем головку на высоту щупа в любую из трех точек стола. Например G1 Z9 X-52 Y-30
    2. Сравниваем высоту центральной точки и высоту точек A,B,C. (Если высота точек A, B, C разная, необходимо вернутся к предыдущей калибровки.)
    3. Если высота центральной точки больше остальных, то линза выпуклая и необходимо увеличить значение дельта радиуса. Увеличивать или уменьшать желательно с шагом +-0,2мм, при необходимости уменьшить или увеличить шаг в зависимости от характера и величины искривления (подбирается экспериментально)
    4. Команды:
      G666 R67,7
      M500
      G28
    5. Подгоняем дельта радиус пока наша плоскость не выровняется
    3 Этап. Находим истинную высоту от сопла до столика

    Третьим этапом мы подгоняем высоту печати (от сопла до нижней плоскости — столика) Так как мы считали, что общая высота заведомо не правильная, необходимо ее откорректировать, после всех настроек высот осей. Можно пойти двумя путями решения данной проблемы:
    1 Способ:
    Подогнав вручную наше сопло под щуп, так что бы оно свободно под ним проходило, но при этом не было ощутимого люфта,

    • Командой M114 выводим на экран значение фактической высоты нашего HotEnd’а
    • Командой M666 L получаем полное значение высоты (Параметр H)
    • После чего вычитаем из полной высоты фактическую высоту.
    • Получившееся значение вычитаем из высоты щупа.

    Таким образом мы получаем величину недохода сопла до нижней плоскости, которое необходимо прибавить к полному значению высоты и и записать в память принтера командами:
    G666 H 235.2
    M500
    G28

    2 Способ:
    Второй способ прост как валенок. С “потолка”, “на глаз” прибавляем значение высоты (после каждого изменение не забываем “уходить” в home), добиваясь необходимого значения высоты, но есть шанс переборщить со значениями и ваше сопло с хрустом шмякнется об стекло.

    Как сделать авто калибровку для вашего принтера и что при этом авто калибрует принтер вы узнаете из следующих статей.

    Вы можете помочь и перевести немного средств на развитие сайта

    Добавить комментарий