Генериране на създаване на договор за създаване на "създаване на...
Преводач
Тази страница е преведена автоматично от услугата за машинен превод на Microsoft. Разберете повече

Блог на Microsoft преводач

Преводът на Microsoft носи край до край на речта на всички с първия в света API за превод на реч

Днес пуснахме нова версия на API за преводач на Microsoft , което добавя възможности за превод в реално време (и говор към текст) към съществуващия API за превод на текст. Благодарение на най-съвременните технологии за изкуствен интелект на Microsoft, тази възможност е достъпна за милиони потребители на Skype повече от година, и да фърмуер И Android Потребителите на приложенията на Microsoft преводач от края на 2015. Сега предприятията ще могат да добавят тези възможности за превод на реч към своите приложения или услуги и да предложат по-естествени и ефективни потребителски изживявания на своите клиенти и персонал.

Преводът на реч е достъпен за осем езика – Арабски, Китайски мандарин, английски, френски, немски, италиански, португалски и испански. Преводът в текст е наличен във всички 50 + поддържани езици. Преводът на говоримия звук се предлага на 18 поддържани езика.

Тази нова версия на Microsoft Преводач е първото решение за превод от край до край, оптимизирано за разговори в реалния живот (срещу прости човешки към машинни команди), налично на пазара. Преди днес решенията за превод на реч, които трябва да бъдат заедно от редица различни API (разпознаване на реч, превод и синтез на реч), не са оптимизирани за разговорно изказване или са проектирани да работят помежду си. Сега, крайните потребители и предприятията могат да премахнат езиковите бариери с интегрирането на превода на реч в познатите им приложения и услуги.

 

Как може Моят бизнес да използва технологията за превод на реч?

Преводът на реч може да се използва в различни сценарии от човек на човек, група или човек към машина. Сценариите "лице в лице" може да включват еднопосочен превод, като например личен превод, субтитри или дистанционно или многоезичен комуникации, подобно на това, което се намира в момента в Skype преводача или приложенията на Microsoft преводач за iOS и Android. Груповите сценарии могат да включват презентации в реално време, като например известия за събития, уеб предавания и университетски класове, или събирания, като например срещи на лица или онлайн игрови чатове. Сценарии за човек към машина може да включва сценарии за бизнес разузнаване (като анализ или клиент извиква трупи) или AI взаимодействия.

Ние просто започваме да надраскаме повърхността на сценариите, където тази технология ще помогне и, тъй като е базирано на машинно обучение, неговото качество и следователно приложимостта ще се подобри с времето, тъй като повече хора и компании го използват.

Няколко партньорски компании са тествали API и са го интегрирали в собствените си приложения:

  • Теле 2 на Швеция, водещ мобилен оператор с повече от 15 000 000 абонати в над 15 страни, интегриран преводач в техните телефонна централа за поддръжка в реално време телефонни обаждания преводи (не е необходимо приложение!) на тяхната клетъчна мрежа.
  • Лъвови мостове (Бостън, УО), доставчик на езикови услуги и партньор за преводач на Златни нива, разработи интегриран разтвор за видео субтитри.
  • Проглухи, доставчик на приложения, специализиран в разработването на технологии за подкрепа на трудно слуховите и глухи общности, интегрира новия API в тяхното приложение аватар знак език, за да се даде възможност на многоезична подкрепа на реч за подписване сценарии.

 

Как работи преводът на реч?

Преводът на реч в реч е много сложно предизвикателство. Той използва най-новите ии технологии, като дълбоки невронни мрежи за разпознаване на реч и текст превод. Днес на пазара няма друг напълно интегриран разтвор за превод на реч, който да предоставя платформа, която да подкрепя сценариите за превод в реалния живот, които са необходими, за да не се налага просто да зашиваш съществуващото разпознаване на реч и технологии за превод на текст. Преводът на реч има четири етапа, за да може да достави това преживяване:

  1. Автоматично разпознаване на реч (ASR) — Дълбока невронна мрежа, обучена на хиляди часове аудио анализира входящата реч. Този модел е обучен за човешки взаимодействия, а не за човешки команди, създавайки разпознаване на реч, което е оптимизирано за нормални разговори.
  2. "Труд за "Иновации на Microsoft", TrueText взема буквален текст и го преобразува, за да отразява по-подробно потребителското намерение. Тя постига това чрез премахване на дисфлуразите на говора, като "UM" и "Ah", както и заеквания и повторения. Текстът също така се прави по-четлив и преведящ чрез добавяне на прекъсвания на изречения, правилна пунктуация и главни букви. (вижте снимката по-долу)
  3. Превод Текстът се превежда на всеки от 50-те езика, поддържани от преводача на Microsoft. Осемте езика на говора са допълнително оптимизирани за разговори чрез обучение на милиони думи на разговорни данни с помощта на дълбоки невронни мрежи задвижвани езикови модели.
  4. Текст в реч – Ако целевият език е един от осемнадесетте езика за говор, който се поддържа, текстът се преобразува в реч изход чрез синтез на реч. Този етап е пропуснат в сценарии за превод на реч към текст, като например видео субтитри.

Как да започна?

Лесно е да започнете с новия API за реч на Microsoft преводач. Безплатен 10-часов пробен период е на разположение на aka.ms/TranslatorADMSpeech. Можете да тествате настройването и внедряването във виртуална среда, както и да прочетете документацията за API на нашия нов Страница на Суагър. Можете също да намерите примерни приложения и друга полезна информация за Github.

Разбира се, ако имате въпроси, проблеми или обратна връзка, ще се радваме да го чуем! Можете да ни кажете на информация и форум за подкрепа.

Разберете Повече