Microsoft Translator, dünyanın ilk konuşma çevirisi API 'sı olan herkese uçtan uca konuşma çevirisi sunar
Bugün, yeni bir sürümünü yayımladı Microsoft Translator API gerçek zamanlı konuşma-konuşma (ve metin konuşma) çeviri yetenekleri varolan metin çevirisi API ekler. Microsoft 'un en son teknolojiye sahip yapay zeka teknolojileri tarafından desteklenen bu özellik, milyonlarca kullanıcı için kullanılabilir Skype bir yıldan fazla ve IOS Ve Android 2015 geç beri Microsoft Translator uygulamaları kullanıcıları. Şimdi, işletmeler bu konuşma çevirisi yeteneklerini kendi uygulamalarına veya hizmetlerine ekleyebilecek ve müşterilerine ve personeline daha doğal ve etkili kullanıcı deneyimleri sunabilecektir.
Konuşma çevirisi sekiz dilde kullanılabilir — Arapça, Çince Mandarin, Ingilizce, Fransızca, Almanca, Italyanca, Portekizce ve Ispanyolca. Metne çeviri, tüm Microsoft Translator 'da kullanılabilir 50 + desteklenen diller. Konuşulan ses çevirisi 18 desteklenen dilde mevcuttur.
Microsoft Translator 'ın bu yeni sürümü, piyasada bulunan gerçek yaşam konuşmaları (vs. basit insan makine komutları) için optimize edilmiş ilk uçtan uca konuşma çevirisi çözümüdür. Bugünden önce, bir dizi farklı API 'den (konuşma tanıma, çeviri ve konuşma sentezi) birlikte Arnavut kaldırmanız gereken konuşma çevirisi çözümleri, konuşma konuşması için optimize edilmemiştir veya birbirleriyle çalışmak üzere tasarlanmıştır. Şimdi, son kullanıcılar ve işletmeler aynı dil engelleri tanıdık uygulamaları ve hizmetlerinde konuşma çeviri entegrasyonu ile kaldırabilirsiniz.
Nasıl iş konuşma çeviri teknolojisini kullanabilir miyim?
Konuşma çevirisi, çeşitli kişi-kişi, Grup veya insan-makine senaryoları için kullanılabilir. Kişi-kişi senaryoları, kişisel çeviri, altyazı veya uzak ya da Skype çevirmen veya iOS için Microsoft Translator uygulamalarında Şu anda bulunan benzer bir kişi çok dilli iletişim gibi tek yönlü çeviri içerebilir ve Android. Grup senaryoları, olay Keynotes, Web yayınları ve üniversite sınıfları gibi gerçek zamanlı sunumlar veya kişi toplantıları veya çevrimiçi oyun sohbet odaları gibi toplantılar içerebilir. Insan-makine senaryoları iş zekası senaryoları (örneğin, analiz veya müşteri çağrıları günlükleri) veya AI etkileşimleri içerebilir.
Biz sadece bu teknolojinin yardımcı olacak senaryoların yüzeyini çizilmeye başlıyor ve makine öğrenimi bazlı olduğu gibi, kalitesi ve bu nedenle uygulanabilirlik daha fazla insan ve şirket kullanarak zaman artıracak.
Çeşitli ortak şirketler API test ve kendi uygulamalarına entegre:
- Tele 2 Isveç, 15 ' den fazla ülkede 15.000.000 ' den fazla aboneye sahip lider bir mobil operatör, kendi hücresel ağ üzerinde gerçek zamanlı telefon görüşmeleri çevirileri (hiçbir uygulama gerekli!) desteklemek için kendi PBX içine entegre çevirmen.
- LionBridge (Boston, MA), bir dil servis sağlayıcısı ve Gold Level Translator ortağı, entegre bir video altyazı çözümü geliştirdi.
- ProDeaf Tradutor, zor işitme ve sağır topluluklar desteklemek için teknolojiler geliştirme konusunda uzmanlaşmış bir uygulama satıcısı, senaryolar imzalamak için konuşma çok dilli destek sağlamak için kendi işaret dili avatar uygulaması içine yeni API entegre.
Konuşma çevirisi nasıl çalışır?
Konuşma-konuşma çevirisi çok karmaşık bir sorundur. Konuşma tanıma ve metin çevirisi için derin sinir ağları gibi en son AI teknolojilerini kullanır. Bugün piyasada mevcut olan başka tam entegre konuşma çevirisi çözümü yoktur ve gerçek yaşam konuşma çevirisi senaryolarını destekleyecek bir platform sunarak sadece mevcut konuşma tanıma ile birlikte dikiş metin çeviri teknolojileri. Bu deneyimi teslim edebilmek için konuşma tercümesi dört aşama vardır:
- Otomatik konuşma tanıma (ASR) — Binlerce saat boyunca eğitilmiş derin bir sinir ağı, gelen konuşmayı analiz eder. Bu model, insan-to-makine komutları, normal sohbetler için optimize edilmiş konuşma tanıma üreten yerine insan-insan etkileşimleri üzerinde eğitilmiştir.
- DoğruMetin Microsoft Research yenilik, TrueText değişmez metin alır ve daha yakından Kullanıcı amacını yansıtmak için dönüştürür. Bu, "um" s ve "Ah" s gibi konuşma disfluencies, yanı sıra atlar ve tekrarlar kaldırarak elde. Metin Ayrıca, cümle sonları, uygun noktalama işaretleri ve büyük harfe çevirme ekleyerek daha okunabilir ve çevrilebilir hale gelmiştir. (aşağıdaki resme bakın)
- Çeviri Metin, Microsoft Translator tarafından desteklenen 50 ' den fazla dile çevrilir. Sekiz konuşma dili, derin sinir ağları destekli dil modellerini kullanarak konuşma verilerinin milyonlarca kelime üzerinde eğitim tarafından görüşmeler için daha da optimize edilmiştir.
- Metin konuşma — Hedef dil desteklenen on sekiz konuşma dillerinden biri ise, metin konuşma sentezi kullanarak konuşma çıktısına dönüştürülür. Bu aşama, video altyazı gibi konuşma-metin çeviri senaryolarda atlanıyor.
Nasıl başlamam?
Yeni Microsoft Translator konuşma API 'sini kullanmaya başlamak kolaydır. Ücretsiz 10 saatlik deneme sürümü aka.ms/TranslatorADMSpeech. Sanal bir ortamda kurulum ve uygulama test edebilirsiniz yanı sıra yeni bizim API belgelerini okumak Swagger sayfası. Ayrıca, örnek uygulamaları ve diğer yararlı bilgileri de bulabilirsiniz Github.
Tabii ki, sorularınız varsa, sorunlar, ya da geribildirim, biz duymak isteriz! Bize bildirin olabilir bizim geribildirim ve Destek Forumu.
Daha fazla bilgi edinin