Przełom w tłumaczeniu mowy z naszych zespołów badawczych
Jest to rok uczenia maszynowego i dużych zbiorów danych. Czy jest przewidując wyniki polityczne, superładowanie arkusze kalkulacyjne programu ExcelPomaga Mapowanie kwerend do intencji w Search, a nawet Dostosowywanie aparatu tłumaczeniowego w celu najlepszego dopasowania treści – te obszary badawcze odgrywają główną rolę w przekształcaniu technologii i produktywności.
Kilka tygodni wstecz, w 14 rocznym Informatyka w konferencji XXI wieku, uczestnicy zobaczyli, gdzie indziej te technologie biorą nas-i kochał. Rick Rashid, który kieruje się Microsoft Research na całym świecie, udał się na scenie i w rozpiętości ośmiu zdań, ale 2000 + silny tłum się na nogach i doping. To był moment, w którym Technologia była nie do odróżnienia od magii -i taki, który pobudzi pisarzy science fiction, aby rozpocząć myślenie o większych wyzwań dla naukowców do walki 🙂
Obejrzyj film, aby się przekonać:
Połączenie potężnych technologii zostały wykorzystane do tej niesamowitej demonstracji możliwe: głębokie neuronowe sieci oparte przetwarzania w połączeniu z wysokowydajnych obliczeń pozwoliło znaczący skok w dokładności rozpoznawania mowy. Tthe Technologia Microsoft Translator którego używasz każdego dnia Dostosowane najlepiej dopasować zawartość mowy Ricka. Nowa technologia syntezy mowy, która umożliwia personalizację charakterystyk akustycznych, była w stanie stworzyć "głos Ricka" w języku, którego nie mówi. Możesz przeczytać Rick wpis na blogu tutaj.
Niektóre z tych technologii są już dziś dostępne, zwłaszcza w branży tłumaczenia (Microsoft Translator) z możliwościami dostosowywania (Centrum tłumacza). Użytkownicy systemu Windows Phone cieszą się najbardziej innowacyjna aplikacja tłumaczeniowa na dowolnym telefonie od ponad roku, który obejmuje wczesne doświadczenie tłumaczenia mowy, który został dostosowany do sytuacji w podróży. Wyjście audio, które słyszysz na Translator Bing Strona korzysta z niektórych nowszych silników syntezy mowy pochodzących z naszych badań Speech. Deep-neuronowych badań netto jest również za nasze audio/video usługi indeksowania- MAVIS, która jest dostępna komercyjnie.
Emocje, które zostały Falujący całej Tthe Sieci web w odpowiedzi na tę demonstrację jest wskaźnikiem tego, jak bardzo każdy chce doświadczyć tej "magii". Jest wiele do zrobienia, ale zobaczysz korzyści płynące z tego wspaniałego badania w naszych produktach w przyszłych wydaniach.
Vikram dendi
Dyrektor
Microsoft/Bing Translator & Microsoft Research