Нейронный перевод активно конкурирует с человеком
1-2 августа во Флоренции состоялась Четвертая конференция по машинному переводу (WMT-2019), организованная Ассоциацией компьютерной лингвистики (ACL). В мероприятии приняли участие крупные международные разработчики, в том числе – компания PROMT.
Каждый год, в рамках Ассоциации компьютерной лингвистики, специалисты в области машинного перевода, представители коммерческих организаций и научно-исследовательских групп со всего мира соревнуются друг с другом. В течение определенного времени они тренируют свои системы на материалах, предоставленных в рамках соревнования. Как правило, это тексты ООН и новости. После тренировки участники делают тестовые переводы с помощью своих систем и предоставляют их для экспертной и автоматической оценки.
В последние несколько лет участники конференции активно представляют системы перевода на основе нейронных сетей. В рамках конференции много говорили о том, что нейросетевые технологии демонстрируют беспрецедентный рост качества машинного перевода. В связи с этим организаторы и участники конференции задумались над обновлением метрик для оценки качества перевода и сравнения систем. Например, было предложено уйти от сравнения качества перевода на отдельных предложениях к сравнению качества перевода документов целиком.
Компанию PROMT на WMT-2019 с новой технологией PROMT Neural представлял Александр Молчанов, руководитель отдела статистического и нейросетевого перевода. Он принял участие в постерной сессии, пообщался с коллегами и организаторами мероприятия, познакомил присутствующих с разработками и исследованиями PROMT в области нейронных сетей.
«Сегодня качество перевода неспециализированных текстов с помощью нейронных сетей очень высокое», – отметил он. – «Основной вызов сейчас – это возможность обучать нейронную сеть на разных типах данных от заказчика: на специализированных корпусах параллельных текстов разного объёма или глоссариях. Кроме того, важно уметь подбирать тематически релевантный материал, если у заказчика нет данных для обучения нейронных сетей».