מתרגם מיקרוסופט מביא לתרגום דיבור מקצה לקצה לכולם עם ה-API הראשון בעולם לתרגום דיבור
היום, שיחררו גרסה חדשה של API של מתרגם מיקרוסופט המוסיפה יכולות תרגום בזמן אמת לדיבור (ודיבור לטקסט) לממשק התכנות הקיים של תרגום הטקסט. יכולת זו, המונעת על ידי טכנולוגיות המודיעין המלאכותי החדיש של מיקרוסופט, הייתה זמינה למיליוני משתמשים של סקייפ במשך יותר משנה, ול iOS ו אנדרואיד משתמשי האפליקציות של מתרגם מיקרוסופט מאז סוף 2015. כעת, עסקים יוכלו להוסיף יכולות תרגום דיבור אלה ליישומים או לשירותים שלהם ולהציע חוויות משתמש טבעיות ויעילות יותר ללקוחות ולצוות שלהם.
תרגום דיבור זמין לשמונה שפות- ערבית, סינית מנדרינית, אנגלית, צרפתית, גרמנית, איטלקית, פורטוגזית וספרדית. תרגום לטקסט זמין בכל מתרגם של מיקרוסופט 50 + שפות נתמכות. תרגום לשמע מדוברת זמין ב -18 שפות נתמכות.
גירסה חדשה זו של Microsoft מתרגמת היא הפתרון הראשון לתרגום דיבור מקצה לקצה הממוטב לשיחות בחיים אמיתיים (לעומת פקודות של אדם פשוט למחשב) הזמינות בשוק. לפני היום, פתרונות תרגום דיבור צריך להיות מרוצף יחד ממספר ממשקי api שונים (זיהוי דיבור, תרגום, וסינתזה דיבור), לא היו ממוטבים לדיבור שיחה או שתוכננו לעבוד זה עם זה. כעת, משתמשי קצה ועסקים כאחד יכולים להסיר מחסומי שפה עם שילוב של תרגום דיבור ביישומים ובשירותים המוכרים שלהם.
איך העסק שלי יכול להשתמש בטכנולוגיית תרגום דיבור?
תרגום דיבור יכול לשמש במגוון תרחישים של אדם-לאדם, קבוצה או אדם למחשב. תרחישים של אדם לאדם עשויים לכלול תרגום כיוון אחד כגון תרגום אישי, כתוביות משנה או תקשורת מרוחקת או מרובת לשוני, בדומה למה שנמצא כעת במתרגם סקייפ או ביישומי Microsoft מתרגם עבור iOS ו אנדרואיד. תרחישי קבוצה יכולים לכלול מצגות בזמן אמת, כגון מפתחות אירועים, שידורי אינטרנט ושיעורי אוניברסיטה, או התכנסויות כגון: פגישות אדם או חדרי משחקים מקוונים. תרחישים של אדם למחשב יכולים לכלול תרחישי מודיעין עסקי (כגון יומני הניתוח או שיחות הלקוח) או אינטראקציות AI.
אנחנו רק מתחילים לשרוט את פני השטח של התרחישים שבהם טכנולוגיה זו תסייע, ומאחר שהיא מבוססת על למידה ממוחשבת, איכותו ולכן הישימות תשפר עם הזמן יותר אנשים וחברות משתמשים בו.
חברות שותפות אחדות בדקו את ה-API והשתלבו באפליקציות שלהם:
- מיכל הטלה 2 של שבדיה, מפעיל נייד מוביל עם יותר מ-15,000,000 מנויים בלמעלה מ-15 מדינות, מתרגם משולב לתוך PBX שלהם כדי לתמוך תרגומים בזמן אמת שיחות טלפון (אין צורך app!) ברשת הסלולרית שלהם.
- גשר לארי (בוסטון, MA), ספק שירותי שפה ושותף מתרגם ברמה זהב, פיתח פתרון משולב של כתוביות וידאו.
- הפרוחרשים, מספק יישומים המתמחה בפיתוח טכנולוגיות לתמיכה בקהילות הקשות לשמיעה והחירשים, שילב את ה-API החדש באפליקציה של שימוש בשפת הסימנים כדי לאפשר תמיכה מרובת-לשוני בדיבור כדי לחתום על תרחישים.
כיצד פועלת תרגום דיבור?
תרגום דיבור לדיבור הוא אתגר מורכב מאוד. היא משתמשת בטכנולוגיות AI העדכנית ביותר, כגון רשתות עצביות עמוקות לזיהוי דיבור ותרגום טקסט. אין פתרון משולב באופן מלא תרגום דיבור זמין בשוק היום ואספקת פלטפורמה שתתמוך החיים האמיתיים התרגום תרחישים הדרושים הולך מעבר פשוט תפרים יחד זיהוי דיבור קיים ו טכנולוגיות תרגום טקסט. יש ארבעה שלבים לתרגום דיבור כדי שתוכל לספק את החוויה הזאת:
- זיהוי דיבור אוטומטי (ASR) — רשת עצבית עמוקה התאמן על אלפי שעות של דיבור מנתח אודיו נכנסות. מודל זה מאומן על האינטראקציות של האדם לאדם במקום פקודות של אדם למכונה, הפקת זיהוי דיבור הממוטב לשיחות רגילות.
- TrueText — חידוש מחקר של Microsoft, TrueText לוקח את הטקסט הליטרלי והופך אותו ליותר משקף את כוונת המשתמש. היא משיגה זאת על-ידי הסרת השהיות דיבור, כגון "um" ו-"ah", כמו גם שיבושים וחזרות. כמו כן, הטקסט נעשה קריא יותר וניתן לתרגום על-ידי הוספת מעברי משפט, סימני פיסוק נכונים ורישיות. (ראה תמונה להלן)
- תרגום הטקסט מתורגם לכל אחת מ-50 + שפות הנתמכות על-ידי Microsoft מתרגם. שמונה שפות הדיבור כבר אופטימיזציה יותר עבור שיחות על ידי הכשרה על מיליוני מילים של נתונים שיחה באמצעות רשתות עצביות עמוק בדגמי השפה.
- טקסט לדיבור- אם שפת היעד היא אחת משמונה שפות הדיבור הנתמכות, הטקסט יומר לפלט דיבור באמצעות סינתזה של דיבור. שלב זה מושמט בתרחישי תרגום של דיבור לטקסט, כגון כתוביות וידאו.
כיצד ניתן להתחיל?
קל להתחיל לעבוד עם ה-API החדש של מתרגם הדיבור של Microsoft. ניסיון של 10 שעות בחינם זמין ב aka.ms/TranslatorADMSpeech. באפשרותך לבדוק את ההתקנה וההטמעה בסביבה וירטואלית, כמו גם לקרוא את תיעוד ה-API במחשב החדש שלנו עמוד סוואגר. ניתן גם למצוא אפליקציות לדוגמה ומידע שימושי אחר על בעלי האוב.
כמובן, אם יש לך שאלות, בעיות או משוב, אנחנו נשמח לשמוע את זה! אתה יכול ליידע אותנו. ב משוב ופורום תמיכה.
למד עוד