Facebook утверждает, что ее экспериментальный переводчик на основе нейросетей в девять раз быстрее конкурирующих систем

Facebook утверждает, что ее экспериментальный переводчик на основе нейросетей в девять раз быстрее конкурирующих систем Как известно, главная миссия крупней соцсети в мире Facebook – «сделать мир более связанным и открытым». Но едва ли это возможно сделать, полностью не решив все трудности, связанными с языковыми барьерами между людьми.

Поиском необходимого решения занимается соответствующая команда специалистов подразделения Facebook, специализирующегося на разработках в области искусственного интеллекта. Собственно говоря, языковые переводы всегда были одним из главных направлений этого подразделения. Судя по всему, за последнее время команда достаточно далеко продвинулись в разработке соответствующей технологии. Прототип новейшей системы машинного перевода Facebook, как заверяет сама компания, работает в девять раз быстрее конкурирующих систем.

Сейчас эта система – лишь исследовательский проект. То есть, пока она не используется ни в одном коммерческом продукте компании. Но вероятность внедрения этой системы в сервисы Facebook очень высока. По крайней мере, в этом источник заверили разработчики из ИИ-подразделения Facebook Майкл Аули и Дэвид Гранжер.

Соцсеть уже использует ИИ для нескольких задач, включая автоматический перевод статусных обновлений на другие языки, но покинуть стены лаборатории технология пока не готова. Разработчикам еще требуется время на доработку некоторых аспектов, сколько конкретно – не уточняют.

Сейчас команда работает над обеспечением работоспособности системы в стенах компании и решает трудности при переводе, обусловленные различиями между функциональными стилями речи, а точнее, между научным стилем и разговорным. Ранее Facebook говорила, что создает глоссарий сленга, чтобы максимально облегчить эту задачу.

Аули и Гранжер уже сейчас говорят об успешности «передового» подхода компании. Отличие разработки Facebook заключатся в архитектуре. По словам разработчиков, обычно все ИИ-системы построены на рекуррентных нейронных сетях (RNN), тогда как система Facebook использует сверточные нейронные сети (CNN). Для RNN характерная строгая последовательность анализа данных – двигаясь в направлении слева направо, система слово за словом переводит все предложение целиком. В случае с CNN различные аспекты данных рассматриваются одновременно – данный стиль вычислений (параллельные вычисления) намного лучше подходит для графических ускорителей, наиболее широко используемых для обучения самых современных нейронных сетей. Таким образом, CNN обеспечивают более основательный подход к выполнению поставленной задачи, позволяя анализировать структуры предложений на более высоком уровне. По словам Аули, сверточные нейронные сети позволяют выстроить поверх текста логическую структуру, что немного похоже на лингвистику.

Адаптировать RNN для перевода – очень непростая задача. Это ответ на вопрос, почему же этот подход в виду очевидных преимуществ не снискал широкого применения. В отличие от большинства других команд, Facebook хватило упорства довести дело до конца и приспособить сети CNN для выполнения языковых переводов. Теперь осталось лишь доработать систему для коммерческого использования.

  • Работы в этом направлении ведут и другие компании, включая ключевого игрока Google.
  • Последняя начала переводить свой переводчик на нейронные технологии в ноябре прошлого года. Первоначально система NMT поддерживала только мандаринский китайский язык. Затем перечень поддерживаемых языков был расширен английским, французским, немецким, испанским, португальским, японским, корейским и турецким.
  • В марте этого года система выучила еще три языка: хинди, русский и вьетнамский.
  • А совсем недавно NMT получила поддержку украинского языка.

Добавить комментарий


Защитный код
Обновить

2 megabytes