Microsoft Custom Translator приближает планку качества перевода к человеческому паритету
Путешествие custom Translator, чтобы быть на переднем крае технологии машинного перевода продолжается.
В начале августа 2020 года мы начали обновление Custom Translator с долгосрочной краткосрочной памяти (так называемая LSTM) на основе архитектуры перевода нейронных машин (или V1) до современной архитектуры transformer (или V2) нашей Microsoft Translator. V2 - это та же архитектура перевода, которая питает стандартный непривычный API переводчика, а также перевод в Microsoft Office 365, Speech, Bing.com/translator, Edge и многое другое.
Августовский релиз позволил клиентам использовать Словарь (фраза или предложение) тип документа для создания пользовательских моделей поверх платформы V2 для быстрого улучшения качества перевода по сравнению с платформой V1.
Сегодня Custom Translator завершила полное обновление платформы V2, чтобы обеспечить еще больший прирост качества перевода, чем раньше. Теперь клиенты могут создавать пользовательские модели со всеми типами документов (обучение, тестирование, настройка, словарь фраз и словарь предложений), используя полные текстовые документы, такие как офисные документы, PDF-файлы, HTML и простой текст.
С помощью этого релиза предприятия, малые и средние предприятия, разработчики приложений и поставщики языковых услуг могут создавать передовые пользовательские системы нейронного перевода, которые уважают их определенную бизнес-терминологию и легко интегрируют эти системы в существующие или новые приложения, рабочие процессы и веб-сайты для привлечения клиентов и развития бизнеса.
Мы ставим каждую новую базовую языковую модель через строгий процесс оценки человека, чтобы гарантировать, что качество перевода продолжает соответствовать высоким стандартам по общим входным данным во всех областях. Однако, с помощью специализированных систем перевода, обученных на заказ, клиенты могут добиться гораздо более высокого соблюдения терминологии и стиля домена путем обучения пользовательской системе перевода на ранее переведенных, в доменных документах. Эти ранее переведенные документы позволяют Custom Translator изучать предпочтительные переводы в контексте, поэтому Переводчик может применять эти термины и фразы, когда контекст требует этого, и производить беглый перевод на целевом языке, уважая контексто-зависимую грамматику целевого языка.
Преимущества обновления
Мы используем Блю балл (стандартный способ в научном сообществе) для измерения качества перевода недавно обученной базовой модели. Один или два BLEU точки получить является достойным достижением. Обновление платформы Custom Translator V2 позволит значительно улучшить ситуацию по сравнению с предыдущей платформой V1. На диаграмме бара ниже показано улучшение качества перевода BLEU для некоторых областей и влияние размера набора данных обучения.
Примеры доменов качество перевода BLEU оценка при использовании стандартного переводчика, пользовательский переводчик V1, и пользовательский переводчик V2.
Размер набора учебных данных в тысячах ('auto-28k' означает 28 000 параллельных предложений для автомобильной области)
Важно отметить, что фактическое улучшение качества зависит от качества данных клиентов, размера набора учебных данных и охвата доменов.
«Мы надеемся, что перевод через нейронную сеть не только повысит качество и скорость, но и предложит достижения в оценке больших данных», сказал Николас Мейер-Аун, руководитель отдела качества и управления поставщиками языков в Volkswagen AG
Пользовательский переводчик будет предлагать БЕСПЛАТНОе обновление до V2. Вы можете переобучить одну модель для проекта в рабочем пространстве на платформу V2 бесплатно. При просмотре проекта следует увидеть сообщение, если у вас все еще есть бесплатный кредит на обновление для этого проекта. Предложение начинается сегодня и заканчивается 31 января 2021 года. После 31 января 2021 года для каждой переподготовки взимается обычная плата за обучение.
Вы можете узнать больше об обновлении до версии 2 в часто задаваемых вопросов ниже.
Вопросы и ответы
- Что вы выпускаете в V2?
Мы выпускаем обновление платформы Custom Translator (V2), чтобы обеспечить значительное улучшение качества перевода с использованием современной архитектуры перевода нейронных машин корпорации Майкрософт. Пользовательский опыт остается таким же, как и в V1. Существует ничего нового, чтобы узнать, просто лучше переводы. Для быстрого переподготовки, пожалуйста, посмотрите это Быстрый запуск видео на YouTube. - В чем преимущество модернизации развернутой в настоящее время модели на платформе V2?
Значительно улучшилось качество перевода; Обновление платформы Custom Translator V2 позволит значительно улучшить работу по сравнению со стандартным Translator и предыдущей платформой V1. На приведенной выше диаграмме приведены оценки качества перевода BLEU для некоторых общих доменов и влияние размера набора учебных данных. - Как использовать БЕСПЛАТНОе обновление до кредита V2?
При просмотре деталей проекта становится видимым бесплатное кредитное сообщение (см. изображения ниже) и будет оставаться видимым до тех пор, пока вы не успешно переобучите модель или предложение не закончится 31 января 2021 года. - Как обновить развернутые (или неразвернутые) пользовательские модели до платформы V2?
Если у вас есть развернутая или неразвернутая только словарная модель, которая была переподготовилась после 3 августа 2020 года, она уже была обновлена до платформы V2. В противном случае следует запустить обучение новой модели. После успешной подготовки новой модели будет видна кнопка "Swap". Нажмите кнопку "Swap", чтобы развернуть новую модель. Примечание: Кнопка "Swap" позволяет не простоя развертывания. То есть все запросы на перевод будут по-прежнему обслуживаться предыдущей моделью до тех пор, пока новая модель не будет развернута и не функционирует, после чего новая модель будет обслуживать новые запросы на перевод, а предыдущая модель будет неразвернута. - Могу ли я продолжать повторно развертывать пользовательские модели V1 после обновления платформы V2?
Да. Мы понимаем, что могут быть причины, по которым клиенты хотели бы продолжать использовать модели, обученные на платформе V1. Модели V1 могут работать на платформе V2. В будущем модели V1 не будут повторно развертываться. Примечание: После переподготовки модели V1, новая модель будет на платформе V2. Вкладка "Модель" покажет все новые (V2) и предыдущие (V1) модели. - Я нов к настраивать переводы, как я могу получить начатым используя таможню переводчик?
Чтобы создать пользовательскую модель, посмотрите видео «Быстрый старт» выше и обратитесь к документации по docs.microsoft.com: https://docs.microsoft.com/azure/cognitive-services/translator/custom-translator/overview
Что вы можете сделать с пользовательским переводчиком Майкрософт
Создавайте пользовательские модели с помощью конкретной терминологии домена и переводите их в режиме реального времени с помощью API Microsoft Translator.
Используйте пользовательский переводчик Майкрософт с помощью решений для перевода, чтобы помочь глобализировать свой бизнес и улучшить взаимодействие с клиентами.
Для получения дополнительной информации о решениях Microsoft Translator, пожалуйста, посетите: https://www.microsoft.com/translator/business.