Bỏ qua và nội dung chính
Translator
Trang này đã được tự động dịch của Microsoft Translator Dịch vụ máy dịch. Tìm hiểu thêm

Blog của Microsoft Translator

Azure AI Custom Translator Neural Dictionary: Cung cấp chất lượng dịch thuật ngữ cao hơn 

Hôm nay, chúng tôi rất vui mừng thông báo việc phát hành từ điển thần kinh, một cải tiến chất lượng dịch thuật đáng kể cho nền tảng của chúng tôi. Trong bài đăng trên blog này, chúng ta sẽ khám phá tính năng từ điển thần kinh.

Giới thiệu  

Từ điển thần kinh là một phần mở rộng cho Từ điển độngTừ điển cụm từ các tính năng trong Azure AI Translator. Cả hai đều cho phép người dùng của chúng tôi tùy chỉnh đầu ra bản dịch bằng cách cung cấp bản dịch của riêng họ cho các thuật ngữ hoặc cụm từ cụ thể. Phương pháp trước đây của chúng tôi sử dụng từ điển nguyên văn, đó là một hoạt động tìm và thay thế chính xác. Từ điển thần kinh cải thiện chất lượng dịch cho các câu có thể bao gồm một hoặc nhiều bản dịch thuật ngữ bằng cách cho phép mô hình dịch máy điều chỉnh cả thuật ngữ và ngữ cảnh để tạo ra bản dịch trôi chảy hơn. Đồng thời, nó bảo tồn độ chính xác dịch thuật cao hạn.  

Ví dụ Anh-Đức sau đây cho thấy sự khác biệt về đầu ra dịch giữa cả hai phương pháp khi yêu cầu dịch thuật ngữ tùy chỉnh: 

Nhập:   Basic Knowledge of <mstrans:dictionary translation=”regelmäßiges Testen”>Periodic Maintenance</mstrans:dictionary>   
Nguyên văn từ điển:   Grundkenntnisse Der RegelmäßigEs Kiểm traen 
Từ điển thần kinh:   Grundkenntnisse Des Regelmäßigen Kiểm traENS 

Cải tiến chất lượng 

Biểu đồ dưới đây minh họa những cải tiến đáng kể mà tính năng mới mang lại trên các bộ kiểm tra thuật ngữ phổ biến có sẵn công khai trong Ô tô (https://aclanthology.org/2021.eacl-main.271), Sức khỏe (https://aclanthology.org/2021.emnlp-main.477) và miền Covid-19 (https://aclanthology.org/2021.wmt-1.69) sử dụng các mô hình dịch thuật chung của chúng tôi. 

Chúng tôi cũng đã tiến hành một loạt các đánh giá của khách hàng trên nền tảng Custom Translator và các mô hình từ điển thần kinh. Chúng tôi đã đo lường mức tăng chất lượng dịch thuật trên dữ liệu khách hàng giữa các mô hình có và không có phần mở rộng từ điển thần kinh. Năm khách hàng đã tham gia, bao gồm tiếng Đức, tiếng Tây Ban Nha và tiếng Pháp trong các lĩnh vực kinh doanh khác nhau.

Biểu đồ dưới đây cho thấy sự cải thiện trung bình của SAO CHỔI trong lĩnh vực giáo dục cho Anh-Đức, Anh-Tây Ban Nha và Anh-Pháp; cho các mô hình chung ở bên trái và cho các mô hình tùy chỉnh ở bên phải. Thanh màu BLUE đại diện cho chất lượng dịch thuật chung mà không có từ điển thần kinh và thanh màu ORANGE thể hiện chất lượng dịch thuật bằng từ điển thần kinh. Đây là những cải tiến trung bình tổng thể trên toàn bộ bộ thử nghiệm. Đối với các phân khúc bao gồm một hoặc nhiều mục từ điển của khách hàng (từ 19% đến 63%), mức cải thiện cao tới +6,3 đến +12,9 điểm COMET. 

 Ngôn ngữ được hỗ trợ  

  • Hiện có sẵn (kể từ ngày 6 tháng 12 năm 2023): Tiếng Trung giản thể, tiếng Pháp, tiếng Đức, tiếng Ý, tiếng Nhật, tiếng Hàn, tiếng Ba Lan, tiếng Nga, tiếng Tây Ban Nha và tiếng Thụy Điển - đến và từ tiếng Anh.  
  • Chúng tôi đang bổ sung thêm trong tương lai. Để biết thông tin cập nhật, hãy tham khảo Ghi chú phát hành Trình dịch tùy chỉnh 

Từ điển thần kinh hoạt động như thế nào 

Từ điển thần kinh không sử dụng thao tác tìm và thay thế chính xác khi xử lý bản dịch thuật ngữ tùy chỉnh. Thay vào đó, nó dịch các thuật ngữ hoặc cụm từ từ điển theo cách phù hợp nhất với toàn bộ ngữ cảnh. Điều này có nghĩa là thuật ngữ này có thể được biến đổi hoặc có cách viết hoa khác nhau, hoặc các từ xung quanh có thể được điều chỉnh, tạo ra một bản dịch trôi chảy và mạch lạc hơn.  

Giả sử, ví dụ, chúng ta có câu nhập liệu sau đây bằng tiếng Anh và bản dịch của nó sang tiếng Ba Lan mà không có bất kỳ cụm từ điển nào như sau:  

Nhập:   Chúng ta cần một giải pháp nhanh chóng có thể hiểu được.  
Bản dịch chuẩn:   Potrzebujemy szybkiego rozwiązania, które będzie zrozumiałe.  

Nếu bạn muốn đảm bảo rằng "giải pháp" được dịch là "Alternatywa" ("một thay thế" trong tiếng Anh), bạn có thể thêm một chú thích từ điển động để đạt được điều đó:  

Nhập:   We need a fast <mstrans:dictionary translation=”Alternatywa“>solution</mstrans:dictionary> that will be understandable.  
Nguyên văn từ điển:   Potrzebujemy szybkicái tôi Alternatywa, który Będzie zrozumiały.  
Từ điển thần kinh:   Potrzebujemy szybkiEJ Thay thếWy, którA Będzie zrozumiałA.  

Đầu ra được tạo ra bởi phương pháp trước đó không trôi chảy vì tính nhất quán về giới tính ngữ pháp bị vi phạm. Từ điển thần kinh tạo ra đầu ra trôi chảy bằng cách a) biến đổi sự thay thế được yêu cầu và b) thay đổi các từ xung quanh khi cần thiết. Nó cũng có thể thay đổi vỏ trong một số trường hợp, như trong ví dụ sau:  

Nhập:   This company’s <mstrans:dictionary translation=”AKCJE“>stock</mstrans:dictionary> is cheap.  
Nguyên văn từ điển:   AKCJE Tej vững chắc pha trò cám ơnni.  
Từ điển thần kinh:   Akcje Tej vững chắc cám ơnNiếp.   

Từ điển thần kinh hy vọng rằng bản dịch được yêu cầu của một thuật ngữ được cung cấp ở dạng ngữ pháp cơ bản của nó. Các thuật ngữ nhiều từ cũng được hỗ trợ và nên được cung cấp dưới dạng cụm danh từ, tức là, các từ không nên được lemmatized một cách độc lập (ví dụ: "bầu cử quốc hội Estonia" sẽ tốt hơn "bầu cử quốc hội Estonia"). 

Cách bật từ điển thần kinh 

Đối với tất cả các ngôn ngữ được hỗ trợ được liệt kê ở trên, từ điển thần kinh ngay lập tức có sẵn cho tất cả khách hàng sử dụng nền tảng Trình dịch tùy chỉnh với Từ điển cụm từ. Cần đào tạo lại mô hình tùy chỉnh đầy đủ (hoặc chỉ từ điển) để bật từ điển thần kinh. 

 Khuyến nghị 

  1. Nếu bạn muốn đảm bảo rằng mục từ điển cụm từ được sử dụng thường xuyên hơn khi làm việc với từ điển thần kinh, bạn có thể xem xét thêm mục nhập cụm từ với phần nguồn dưới nhiều hình thức khác nhau. Trong ví dụ trên, bên cạnh "solution _ Alternatywa", bạn cũng có thể muốn thêm các mục sau: "Giải pháp _ Alternatywa", "Giải pháp _ Alternatywy", "Giải pháp _ Alternatywy".  
  2. Nếu mục tiêu là để đảm bảo rằng một từ hoặc cụm từ cụ thể được sao chép "nguyên trạng" từ văn bản đầu vào sang bản dịch đầu ra khi sử dụng từ điển cụm từ, hãy xem xét thực thi từ điển nguyên văn vì nó có thể nhất quán hơn.   
  3. Tránh thêm bản dịch của các từ hoặc cụm từ phổ biến hoặc thường xuyên vào từ điển cụm từ.  

Để tìm hiểu thêm về Trình dịch tùy chỉnh và cách nó có thể giúp doanh nghiệp của bạn phát triển mạnh trên thị trường toàn cầu, hãy bắt đầu với Hướng dẫn cho người mới bắt đầu Custom Translator. 

Những gì bạn có thể làm với Microsoft Custom Translator 

Xây dựng các mô hình tùy chỉnh với thuật ngữ miền cụ thể của bạn và dịch thời gian thực bằng cách sử dụng Microsoft Translator API. 

Sử dụng Trình dịch tùy chỉnh của Microsoft với các giải pháp dịch thuật của bạn để giúp toàn cầu hóa doanh nghiệp của bạn và cải thiện tương tác của khách hàng. 

Để biết thêm thông tin, hãy truy cập Giải pháp kinh doanh Microsoft TranslatorGhi chú phát hành Trình dịch tùy chỉnh.