Η Microsoft μεταφράστρια παρέχει από άκρο σε άκρο μετάφραση ομιλίας σε όλους με το πρώτο API μετάφρασης ομιλίας στον κόσμο
Σήμερα, ελευθερώθηκαν μια νέα έκδοση του API μετάφρασης της Microsoft που προσθέτει λειτουργίες μετάφρασης ομιλίας σε πραγματικό χρόνο (και ομιλίας σε κείμενο) στο υπάρχον API μετάφρασης κειμένου. Με την υποστήριξη των υπερσύγχρονο τεχνολογιών τεχνητής νοημοσύνης της Microsoft, αυτή η δυνατότητα είναι διαθέσιμη σε εκατομμύρια χρήστες Skype για πάνω από ένα χρόνο, και να Ίος Και Android χρήστες των εφαρμογών μετάφρασης της Microsoft από αργά 2015. Τώρα, οι επιχειρήσεις θα μπορούν να προσθέτουν αυτές τις δυνατότητες μετάφρασης ομιλίας στις εφαρμογές ή τις υπηρεσίες τους και να προσφέρουν πιο φυσικές και αποτελεσματικές εμπειρίες χρηστών στους πελάτες και το προσωπικό τους.
Η μετάφραση ομιλίας είναι διαθέσιμη για οκτώ γλώσσες — Αραβικά, Κινέζικα Μανδαρινικά, Αγγλικά, Γαλλικά, Γερμανικά, Ιταλικά, Πορτογαλικά και Ισπανικά. Η μετάφραση σε κείμενο είναι διαθέσιμη σε όλους τους μεταφραστές της Microsoft 50 + υποστηριζόμενες γλώσσες. Η μετάφραση στον προφορικό ήχο είναι διαθέσιμη σε 18 υποστηριζόμενες γλώσσες.
Αυτή η νέα έκδοση του Microsoft Μεταφράσιμου είναι η πρώτη λύση μετάφρασης ομιλίας από άκρο σε άκρο που έχει βελτιστοποιηθεί για συνομιλίες πραγματικής ζωής (έναντι απλών εντολών ανθρώπινου υπολογιστή) που διατίθενται στην αγορά. Πριν από σήμερα, οι λύσεις ομιλίας που απαιτούνται για να ενωθούν από μια σειρά από διαφορετικά API (αναγνώριση ομιλίας, μετάφραση και σύνθεση ομιλίας), δεν έχουν βελτιστοποιηθεί για συνομιλία ομιλίας ή έχουν σχεδιαστεί για να συνεργαστεί μεταξύ τους. Τώρα, οι τελικοί χρήστες και οι επιχειρήσεις μπορούν να καταργήσουν τα γλωσσικά εμπόδια με την ενσωμάτωση της μετάφρασης ομιλίας στις οικείες εφαρμογές και υπηρεσίες τους.
Πώς μπορεί η επιχείρησή μου να χρησιμοποιεί τεχνολογία μετάφρασης ομιλίας;
Η μετάφραση ομιλίας μπορεί να χρησιμοποιηθεί σε διάφορα σενάρια από άτομο σε άτομο, ομαδικά ή από άνθρωπο σε μηχάνημα. Τα σενάρια χρήστη μπορεί να περιλαμβάνουν μια μετάφραση μίας μετάβασης, όπως προσωπική μετάφραση, υποτιτλισμό ή απομακρυσμένες ή προσωπικές πολύγλωσσεις επικοινωνίες παρόμοιες με αυτές που βρίσκονται αυτήν τη στιγμή στο πρόγραμμα μετάφρασης Skype ή στις εφαρμογές μετάφρασης της Microsoft για iOS και Android. Τα σενάρια ομάδας θα μπορούσαν να περιλαμβάνουν παρουσιάσεις σε πραγματικό χρόνο, όπως πληκτρολόγια εκδηλώσεων, προγράμματα Web και πανεπιστημιακές τάξεις ή συγκεντρώσεις, όπως στις συναντήσεις ατόμων ή στα online chatrooms τυχερών παιχνιδιών. Τα σενάρια από άνθρωπο σε μηχάνημα θα μπορούσαν να περιλαμβάνουν σενάρια επιχειρηματικής ευφυΐας (όπως τα αρχεία καταγραφής κλήσεων ή πελατών) ή τις αλληλεπιδράσεις AI.
Μόλις αρχίζουμε να ξύνω την επιφάνεια των σεναρίων όπου αυτή η τεχνολογία θα βοηθήσει και, καθώς είναι βασισμένη στη μηχανική μάθηση, η ποιότητά της και ως εκ τούτου η εφαρμοσιμότητα θα βελτιωθεί με το χρόνο, καθώς περισσότεροι άνθρωποι και εταιρείες το χρησιμοποιούν.
Αρκετές συνεργαζόμενες εταιρείες έχουν δοκιμάσει το API και το έχουν ενσωματώσει στις δικές τους εφαρμογές:
- Τηλε 2 της Σουηδίας, μια κορυφαία εταιρεία κινητής τηλεφωνίας με περισσότερους από 15.000.000 συνδρομητές σε πάνω από 15 χώρες, ενσωματωμένο μεταφραστή στο ΤΗΛΕΦΩΝΙΚΌ τους κέντρο για να υποστηρίξει σε πραγματικό χρόνο τηλεφωνικές κλήσεις μεταφράσεις (δεν απαιτείται εφαρμογή!) στο δίκτυο κινητής τηλεφωνίας τους.
- Λιονουμπριτζ (Boston, MA), ένας πάροχος υπηρεσιών Γλώσσας και ένας συνεργάτης Μεταφραστής επιπέδου Gold, ανέπτυξε μια ολοκληρωμένη λύση Υποτιτλισμού βίντεο.
- Προκωφάλαλος, ένας προμηθευτής της εφαρμογής που ειδικεύεται στην ανάπτυξη τεχνολογιών για την υποστήριξη της σκληρής ακοής και των Κοινοτήτων κωφών, ενσωματωμένο το νέο API στη νοηματική γλώσσα εφαρμογή avatar τους για να επιτρέψει πολύγλωσση υποστήριξη της ομιλίας για να υπογράψουν σενάρια.
Πώς λειτουργεί η μετάφραση ομιλίας;
Η μετάφραση ομιλίας-ομιλίας είναι μια πολύ περίπλοκη πρόκληση. Χρησιμοποιεί τις τελευταίες τεχνολογίες ΤΕΧΝΗΤΉς νοημοσύνης, όπως βαθιά νευρικά δίκτυα για αναγνώριση ομιλίας και μετάφραση κειμένου. Δεν υπάρχει άλλη πλήρως ενσωματωμένη λύση ομιλίας που να είναι διαθέσιμη στην αγορά σήμερα και να παρέχει μια πλατφόρμα που θα υποστηρίζει σενάρια πραγματικής μετάφρασης σε πραγματικό βίο, που απαιτούνται πέρα από την απλή συρραφή της υπάρχουσας αναγνώρισης ομιλίας και τεχνολογίες μετάφρασης κειμένου. Υπάρχουν τέσσερα στάδια για τη μετάφραση ομιλίας για να είναι σε θέση να παραδώσει αυτή την εμπειρία:
- Αυτόματη αναγνώριση ομιλίας (ASR) — Ένα βαθύ νευρικό δίκτυο, εκπαιδευμένο σε χιλιάδες ώρες ήχου αναλύει την εισερχόμενη ομιλία. Αυτό το μοντέλο έχει εκπαιδευτεί σε αλληλεπίδραση από άνθρωπο σε άνθρωπο και όχι με εντολές από άνθρωπο σε μηχάνημα, δημιουργώντας αναγνώριση ομιλίας που έχει βελτιστοποιηθεί για κανονικές συζητήσεις.
- ΑληθέςΚείμενο Μια καινοτομία της Microsoft στην έρευνα, το ΑληθέςΚείμενο λαμβάνει το κυριολεκτικό κείμενο και το μετατρέπει για να αντικατοπτρίζει πιο προσεκτικά την πρόθεση του χρήστη. Το επιτυγχάνει αυτό αφαιρώντας τις παραμορφώσεις ομιλίας, όπως "um" και "Ah", καθώς και τραυλίζει και επαναλήψεις. Το κείμενο γίνεται επίσης πιο ευανάγνωστο και μεταφράσιμο προσθέτοντας διαλείμματα πρότασης, σωστή στίξη και κεφαλαιοποίηση. (δείτε την παρακάτω εικόνα)
- Μετάφραση Το κείμενο μεταφράζεται σε οποιαδήποτε από τις 50 + γλώσσες που υποστηρίζονται από τη Microsoft μεταφράστρια. Οι οκτώ γλώσσες ομιλίας έχουν βελτιστοποιηθεί περαιτέρω για συνομιλίες με την εκπαίδευση σε εκατομμύρια λέξεις της συνομιλίας δεδομένων χρησιμοποιώντας βαθιά νευρικά δίκτυα που τροφοδοτούνται γλωσσικά μοντέλα.
- Κείμενο σε ομιλία — Εάν η γλώσσα προορισμού είναι μία από τις δεκαοκτώ γλώσσες ομιλίας που υποστηρίζονται, το κείμενο μετατρέπεται σε έξοδο ομιλίας χρησιμοποιώντας τη σύνθεση ομιλίας. Αυτό το στάδιο παραλείπεται σε σενάρια μετάφρασης ομιλίας σε κείμενο, όπως Υποτιτλισμός βίντεο.
Πώς μπορώ να ξεκινήσω;
Είναι εύκολο να ξεκινήσετε με το νέο API ομιλίας μετάφρασης της Microsoft. Διατίθεται δωρεάν δοκιμαστική έκδοση 10 ωρών στο aka.ms/TranslatorADMSpeech. Μπορείτε να δοκιμάσετε την εγκατάσταση και την εφαρμογή σε ένα εικονικό περιβάλλον, καθώς και να διαβάσετε την τεκμηρίωση API για τη νέα μας Σελίδα Σουάγκερ. Μπορείτε επίσης να βρείτε παραδείγματα εφαρμογών και άλλες χρήσιμες πληροφορίες για Github.
Φυσικά, αν έχετε ερωτήσεις, θέματα ή σχόλια, θα θέλαμε πολύ να το ακούσουμε! Μπορείς να μας πεις στην Φόρουμ ανάδρασης και υποστήριξης.
Μάθε περισσότερα