Lompati ke konten utama
Penerjemah
Halaman ini telah diterjemahkan secara otomatis oleh layanan penerjemahan mesin Microsoft Translator. Pelajari lebih lanjut

Microsoft Translator blog

Penerjemah Microsoft menghadirkan terjemahan ucapan end-to-end kepada semua orang dengan API terjemahan ucapan pertama di dunia

Hari ini, kami merilis versi baru dari API penerjemah Microsoft yang menambahkan real-time Speech-to-Speech (dan pidato ke teks) kemampuan terjemahan ke API terjemahan teks yang ada. Didukung oleh teknologi kecerdasan buatan Microsoft yang canggih, kemampuan ini telah tersedia bagi jutaan pengguna Skype selama lebih dari setahun, dan untuk iOS Dan Android pengguna aplikasi Microsoft Translator sejak akhir 2015. Kini, bisnis akan dapat menambahkan kemampuan penerjemahan ucapan ini ke aplikasi atau layanan mereka dan menawarkan pengalaman pengguna yang lebih alami dan efektif kepada pelanggan dan staf mereka.

Terjemahan ucapan tersedia untuk delapan bahasa — Arab, Cina Mandarin, Inggris, Perancis, Jerman, Italia, Portugis dan Spanyol. Terjemahan ke teks tersedia di semua Microsoft Translator 50 + bahasa yang didukung. Terjemahan ke audio yang diucapkan tersedia dalam 18 bahasa yang didukung.

Ini versi baru dari Microsoft Translator adalah yang pertama end-to-end solusi terjemahan pidato dioptimalkan untuk percakapan kehidupan nyata (vs sederhana manusia untuk perintah mesin) yang tersedia di pasar. Sebelum hari ini, solusi penerjemahan ucapan perlu disatukan dari sejumlah api yang berbeda (pengenalan ucapan, terjemahan, dan sintesis ucapan), tidak dioptimalkan untuk pidato percakapan atau dirancang untuk bekerja dengan satu sama lain. Sekarang, pengguna akhir dan bisnis sama-sama dapat menghapus kendala bahasa dengan integrasi terjemahan ucapan dalam aplikasi dan layanan yang familier.

 

Bagaimana bisnis saya dapat menggunakan teknologi penerjemahan ucapan?

Ucapan terjemahan dapat digunakan dalam berbagai orang-ke-orang, kelompok atau manusia-ke-mesin skenario. Skenario orang-ke-orang dapat mencakup terjemahan satu arah seperti terjemahan pribadi, subtitling, atau komunikasi multibahasa atau di-orang yang serupa dengan yang saat ini ditemukan di Skype Translator atau aplikasi Microsoft Translator untuk iOS dan Android. Skenario Grup dapat mencakup presentasi real-time seperti Keynotes acara, webcast, dan kelas Universitas, atau pertemuan seperti di — pertemuan orang atau chatroom game online. Skenario manusia-ke-mesin dapat mencakup skenario intelijen bisnis (seperti log analisis atau panggilan pelanggan) atau interaksi AI.

Kami baru mulai menggaruk permukaan skenario di mana teknologi ini akan membantu dan, karena pembelajaran mesin berbasis, kualitasnya dan karena itu penerapan akan meningkatkan dengan waktu karena lebih banyak orang dan perusahaan yang menggunakannya.

Beberapa mitra perusahaan telah menguji API dan diintegrasikan ke dalam aplikasi mereka sendiri:

  • Tele 2 Swedia, operator seluler terkemuka dengan lebih dari 15.000.000 pelanggan di lebih dari 15 negara, penerjemah terintegrasi ke PBX mereka untuk mendukung terjemahan panggilan telepon real-time (tidak ada aplikasi yang diperlukan!) di jaringan seluler mereka.
  • LionBridge (Boston, MA), penyedia layanan bahasa dan partner Gold level Translator, mengembangkan solusi subtitling video yang terintegrasi.
  • Prodeaf tradutor, vendor aplikasi yang mengkhususkan diri dalam mengembangkan teknologi untuk mendukung keras-of-pendengaran dan tuli masyarakat, mengintegrasikan API baru ke dalam bahasa isyarat mereka aplikasi avatar untuk mengaktifkan dukungan multibahasa pidato untuk menandatangani skenario.

 

Bagaimana cara kerja penerjemahan ucapan?

Pidato-untuk-Speech terjemahan adalah tantangan yang sangat kompleks. Ini menggunakan teknologi AI terbaru, seperti jaringan saraf yang mendalam untuk pengenalan ucapan dan terjemahan teks. Tidak ada solusi terjemahan pidato terintegrasi yang tersedia di pasaran saat ini dan memberikan platform yang akan mendukung skenario terjemahan pidato kehidupan nyata yang diperlukan akan lebih dari sekedar jahitan pengenalan ucapan yang ada dan teknologi penerjemahan teks. Ada empat tahapan untuk berbicara terjemahan untuk dapat memberikan pengalaman ini:

  1. Pengenalan ucapan otomatis (ASR) — Sebuah jaringan saraf yang mendalam dilatih pada ribuan jam audio menganalisa pidato yang masuk. Model ini dilatih mengenai interaksi manusia dengan manusia daripada perintah manusia-ke-mesin, menghasilkan pengenalan ucapan yang dioptimalkan untuk percakapan normal.
  2. TrueText — Sebuah inovasi Microsoft Research, TrueText mengambil teks literal dan mengubahnya untuk lebih dekat mencerminkan niat pengguna. Ini mencapai hal ini dengan menghapus disfluensi pidato, seperti "UM" dan "Ah" s, serta gagap dan pengulangan. Teks ini juga dibuat lebih mudah dibaca dan diterjemahkan dengan menambahkan jeda kalimat, tanda baca yang tepat, dan kapitalisasi. (Lihat gambar di bawah)
  3. Terjemahan Teks diterjemahkan ke dalam salah satu dari 50 + bahasa yang didukung oleh Microsoft Translator. Delapan bahasa pidato telah lebih dioptimalkan untuk percakapan dengan pelatihan pada jutaan kata dari data percakapan menggunakan jaringan saraf yang mendalam model bahasa powered.
  4. Teks pidato- Jika bahasa target adalah salah satu dari delapan belas bahasa pidato yang didukung, teks diubah menjadi output ucapan menggunakan sintesis ucapan. Tahap ini dihilangkan dalam skenario terjemahan ucapan-ke-teks seperti subtitling video.

Bagaimana cara memulainya?

Sangat mudah untuk memulai dengan API baru Microsoft Translator Speech. Uji coba gratis selama 10 jam tersedia di aka.ms/TranslatorADMSpeech. Anda dapat menguji setup dan implementasi dalam lingkungan virtual serta membaca dokumentasi API baru kami Halaman. Anda juga dapat menemukan contoh aplikasi dan informasi berguna lainnya Github.

Tentu saja, jika Anda memiliki pertanyaan, masalah, atau umpan balik, kami akan senang mendengarnya! Anda dapat memberi tahu kami umpan balik dan forum dukungan.

Pelajari lebih lanjut