דלג לתוכן הראשי
תרגום
דף זה תורגם באופן אוטומטי על-ידי שירות תרגום המכונות של Microsoft מתרגם. למד עוד

בלוג מתרגם של מיקרוסופט

Azure AI Custom Translator Neural Dictionary: מספק איכות תרגום טרמינולוגיה גבוהה יותר 

היום, אנו נרגשים מאוד להכריז על שחרורו של מילון עצבי, שיפור משמעותי באיכות התרגום לפלטפורמה שלנו. בפוסט בבלוג זה, נחקור את תכונת המילון העצבי.

מבוא  

מילון עצבי הוא הרחבה ל מילון דינמי ו מילון ביטויים תכונות ב- Azure AI Translator. שניהם מאפשרים למשתמשים שלנו להתאים אישית את פלט התרגום על ידי מתן תרגומים משלהם עבור מונחים או ביטויים ספציפיים. השיטה הקודמת שלנו השתמשה במילון מילה במילה, שהיה פעולת חיפוש והחלפה מדויקת. מילון עצבי משפר את איכות התרגום עבור משפטים שעשויים לכלול תרגום מונח אחד או יותר בכך שהוא מאפשר למודל תרגום המכונה להתאים הן את המונח והן את ההקשר כדי להפיק תרגום שוטף יותר. יחד עם זאת, הוא שומר על דיוק התרגום לטווח גבוה.  

הדוגמה האנגלית-גרמנית הבאה מדגימה הבדלים בתפוקות התרגום בין שתי השיטות כאשר מתבקש תרגום טרמינולוגיה מותאמת אישית: 

קלט:   Basic Knowledge of <mstrans:dictionary translation=”regelmäßiges Testen”>Periodic Maintenance</mstrans:dictionary>   
מילון מילה במילה:   Grundkenntnisse דר regelmäßiges מבחןen 
מילון עצבי:   Grundkenntnisse DES regelmäßigen מבחןENS 

שיפור איכות 

התרשים שלהלן ממחיש את השיפורים המשמעותיים שהתכונה החדשה מביאה לערכות מבחני טרמינולוגיה נפוצות הזמינות לציבור בכלי רכב (https://aclanthology.org/2021.eacl-main.271), בריאות (https://aclanthology.org/2021.emnlp-main.477) ודומיינים של Covid-19 (https://aclanthology.org/2021.wmt-1.69) באמצעות מודלי התרגום הכלליים שלנו. 

ערכנו גם סדרה של הערכות לקוחות על פלטפורמת Custom Translator ומודלים של מילון עצבי. מדדנו את השיפור באיכות התרגום על נתוני לקוחות בין מודלים עם ובלי הרחבת המילון העצבי. חמישה לקוחות השתתפו, שכיסו גרמנית, ספרדית וצרפתית בתחומים עסקיים שונים.

התרשים שלהלן מציג את השיפור הממוצע של שביט בתחום החינוך לאנגלית-גרמנית, אנגלית-ספרדית ואנגלית-צרפתית; עבור דגמים כלליים משמאל, ועבור דגמים מותאמים אישית בצד ימין. סרגלי צבע כחולים מייצגים איכות תרגום כללית ללא מילון עצבי וסרגלי צבע ORANGE מייצגים איכות תרגום באמצעות מילון עצבי. מדובר בשיפורים ממוצעים כלליים בכל מערכי המבחנים. עבור פלחים הכוללים ערך מילון אחד או יותר של לקוח (בין 19% ל -63%), השיפור הוא גבוה כמו +6.3 עד +12.9 נקודות שביט. 

 שפות נתמכות  

  • זמין כרגע (נכון ל-6 בדצמבר 2023): סינית פשוטה, צרפתית, גרמנית, איטלקית, יפנית, קוריאנית, פולנית, רוסית, ספרדית ושוודית – אל ומאנגלית.  
  • אנחנו מוסיפים עוד בעתיד. לקבלת עדכונים, עיין במאמר הערות מוצר של 'מתרגם מותאם אישית' 

כיצד פועל מילון עצבי 

מילון עצבי אינו משתמש בפעולת החיפוש וההחלפה המדויקת בעת טיפול בתרגום טרמינולוגיה מותאמת אישית. במקום זאת, הוא מתרגם מונחים או ביטויים מהמילון באופן המתאים ביותר לכל ההקשר. משמעות הדבר היא כי המונח יכול להיות מוטה או יש מעטפת שונה, או כי המילים שמסביב ניתן להתאים, לייצר תרגום רהוט וקוהרנטי יותר.  

נניח, למשל, שיש לנו את משפט הקלט הבא באנגלית ותרגומו לפולנית ללא ביטויים מילוניים הוא כדלקמן:  

קלט:   אנחנו צריכים פתרון מהיר שיהיה מובן.  
תרגום סטנדרטי:   Potrzebujemy szybkiego rozwiązania, które będzie zrozumiałe.  

אם ברצונך לוודא כי "פתרון" מתורגם כ- "אלטרנאטיווה" ("אלטרנטיבה" באנגלית), באפשרותך להוסיף ביאור מילון דינמי כדי להשיג זאת:  

קלט:   We need a fast <mstrans:dictionary translation=”אלטרנאטיווה“>solution</mstrans:dictionary> that will be understandable.  
מילון מילה במילה:   Potrzebujemy szybkiאגו אלטרנאטיווהקטור,y Będzie zrozumiały.  
מילון עצבי:   Potrzebujemy szybkiאנונימי חלופיוואיקטור,קצת Będzie zrozumiałקצת.  

הפלט שהופק בשיטה הקודמת אינו שוטף מכיוון שעקביות מגדרית דקדוקית מופרת. המילון העצבי מפיק פלט שוטף על ידי א) שיקוף ההחלפה המבוקשת וב) שינוי המילים הסובבות במידת הצורך. זה יכול גם לשנות את המארז במקרים מסוימים, כמו בדוגמה הבאה:  

קלט:   This company’s <mstrans:dictionary translation=”מירב לוי“>stock</mstrans:dictionary> is cheap.  
מילון מילה במילה:   מירב לוי טג' פירמי בצחוק תודהני.  
מילון עצבי:   אקצ'ה טג' פירמי תודהאנונימי.   

מילון עצבי מצפה שהתרגום המבוקש של מונח יסופק בצורתו הדקדוקית הבסיסית. מונחים מרובי מילים נתמכים גם הם ויש לספק אותם כביטויי שם עצם, כלומר, מילים לא צריכות להיות למטיות באופן עצמאי (לדוגמה, "הבחירות לפרלמנט האסטוני" יהיו טובות יותר מ"הבחירות לפרלמנט אסטוניה"). 

כיצד להפעיל מילון עצבי 

עבור כל השפות הנתמכות המפורטות לעיל, מילון עצבי זמין באופן מיידי לכל הלקוחות המשתמשים בפלטפורמת מתרגם מותאם אישית עם מילוני ביטויים. נדרשת הסבה מלאה (או מילונית בלבד) של מודל מותאם אישית כדי להפעיל מילון עצבי. 

 המלצות 

  1. אם ברצונך להבטיח שערך מילון הביטוי ישמש לעתים קרובות יותר בעת עבודה עם מילון עצבי, תוכל לשקול להוסיף את ערך צירוף המילים עם חלק המקור בצורות שונות. בדוגמה לעיל, לצד "פתרון _ אלטרנאטיווה", ייתכן שתרצה להוסיף גם את הערכים הבאים: "פתרון _ אלטרנאטיווה", "פתרונות _ alternatywy", "פתרונות _ alternatywy".  
  2. אם המטרה היא להבטיח שמילה או צירוף מילים מסוימים יועתקו "כמות שהם" מטקסט הקלט לתרגום הפלט בעת שימוש במילון ביטויים, שקול לאכוף מילון מילולי מכיוון שהוא עשוי להיות עקבי יותר.   
  3. הימנע מהוספת תרגומים של מילים או ביטויים נפוצים או תכופים למילון הביטויים.  

לקבלת מידע נוסף על 'מתרגם מותאם אישית' וכיצד הוא יכול לעזור לעסק שלך לשגשג בשוק העולמי, התחל עם מדריך למתרגם מותאם אישית למתחילים. 

מה באפשרותך לעשות עם מתרגם מותאם אישית של Microsoft 

בנה מודלים מותאמים אישית עם המינוח הספציפי לתחום שלך ותרגם בזמן אמת באמצעות API של מתרגם מיקרוסופט. 

השתמש מתרגם מותאם אישית של Microsoft עם פתרונות התרגום שלך כדי לעזור לגלובליזציה של העסק שלך ולשפר את האינטראקציות עם הלקוחות. 

לקבלת מידע נוסף, בקר באתר פתרונות עסקיים של Microsoft Translator ו הערות מוצר של 'מתרגם מותאם אישית'.