콘텐츠로 건너뛰기
번역기
이 페이지는 Microsoft 번역기의 기계 번역 서비스에서 자동으로 번역되었습니다. 자세히

마이크로 소프트 번역기 블로그

Azure AI 사용자 지정 번역기 신경망 사전: 더 높은 용어 번역 품질 제공 

오늘, 번역 품질을 대폭 개선한 신경망 사전의 출시를 발표하게 되어 매우 기쁩니다. 이 블로그 게시물에서는 신경망 사전 기능을 살펴보겠습니다.

소개  

신경 사전은 동적 사전 그리고 구문 사전 기능을 사용할 수 있습니다. 두 기능 모두 사용자가 특정 용어나 구문에 대한 자체 번역을 제공하여 번역 결과를 사용자 지정할 수 있습니다. 이전 방법에서는 정확한 찾기 및 바꾸기 작업인 축어 사전을 사용했습니다. 신경망 사전은 기계 번역 모델이 용어와 문맥을 모두 조정하여 보다 유창한 번역을 생성하도록 함으로써 하나 이상의 용어 번역이 포함될 수 있는 문장의 번역 품질을 향상시킵니다. 동시에 높은 용어 번역 정확도를 유지합니다.  

다음 영어-독일어 예는 사용자 지정 용어 번역이 요청되었을 때 두 방법 간의 번역 결과의 차이를 보여줍니다: 

입력:   Basic Knowledge of <mstrans:dictionary translation=”regelmäßiges Testen”>Periodic Maintenance</mstrans:dictionary>   
축어 사전:   기본 개념 der 규칙적es 테스트en 
신경 사전:   기본 개념 des 규칙적en 테스트ens 

품질 개선 

아래 차트는 새로운 기능이 자동차의 일반 공개 용어 테스트 세트에 가져다주는 중요한 개선 사항을 보여줍니다(https://aclanthology.org/2021.eacl-main.271), 건강 (https://aclanthology.org/2021.emnlp-main.477) 및 Covid-19 도메인(https://aclanthology.org/2021.wmt-1.69) 일반 번역 모델을 사용합니다. 

또한 사용자 지정 번역기 플랫폼과 인공신경망 사전 모델에 대한 일련의 고객 평가를 실시했습니다. 신경망 사전 확장 기능이 있는 모델과 없는 모델 간의 고객 데이터에 대한 번역 품질 향상을 측정했습니다. 다양한 비즈니스 영역에서 독일어, 스페인어, 프랑스어를 사용하는 5개의 고객이 참여했습니다.

아래 차트는 다음과 같은 평균 개선 사항을 보여줍니다. COMET 교육 영역에서 영어-독일어, 영어-스페인어, 영어-프랑스어의 경우 왼쪽은 일반 모델, 오른쪽은 맞춤형 모델입니다. 파란색 막대는 신경망 사전을 사용하지 않은 일반 번역 품질을, 주황색 막대는 신경망 사전을 사용한 번역 품질을 나타냅니다. 이는 전체 테스트 세트의 전반적인 평균 개선도입니다. 고객의 사전 항목이 하나 이상 포함된 세그먼트(19%~63%)의 경우 개선 폭이 +6.3~+12.9 COMET 포인트에 달합니다. 

 지원 되는 언어  

  • 현재 사용 가능(2023년 12월 6일 기준): 중국어 간체, 프랑스어, 독일어, 이탈리아어, 일본어, 한국어, 폴란드어, 러시아어, 스페인어, 스웨덴어 - 영어와 주고받기.  
  • 앞으로 더 많은 기능이 추가될 예정입니다. 업데이트 내용은 다음을 참조하세요. 사용자 지정 번역기 릴리스 노트 

신경 사전의 작동 원리 

신경망 사전은 사용자 정의 용어 번역을 처리할 때 정확한 찾기 및 바꾸기 작업을 사용하지 않습니다. 대신, 전체 문맥에 가장 적합한 방식으로 사전의 용어 또는 구문을 번역합니다. 즉, 용어를 변형하거나 대소문자를 달리하거나 주변 단어를 조정하여 보다 유창하고 일관된 번역을 생성할 수 있습니다.  

예를 들어 영어로 된 다음 입력 문장이 있고 사전 구문 없이 폴란드어로 번역하면 다음과 같다고 가정해 보겠습니다:  

입력:   이해할 수 있는 빠른 솔루션이 필요합니다.  
표준 번역:   이 페이지에 대한 자세한 내용은 해당 페이지에서 확인할 수 있습니다.  

"솔루션"이 ""로 번역되었는지 확인하려는 경우대안"(영어로 "대안")을 입력하는 경우 동적 사전 주석을 추가하여 이를 달성할 수 있습니다:  

입력:   We need a fast <mstrans:dictionary translation=”대안“>solution</mstrans:dictionary> that will be understandable.  
축어 사전:   제품 정보자아 대안, który będzie zrozumiały.  
신경 사전:   제품 정보ej 대안wy, któr będzie zrozumiał.  

이전 방법으로 생성된 출력은 문법적 성별 일관성이 위반되어 유창하지 않습니다. 신경 사전은 a) 요청된 대체어를 변형하고 b) 필요한 경우 주변 단어를 변경하여 유창한 출력을 생성합니다. 또한 다음 예에서와 같이 경우에 따라 대소문자를 변경할 수도 있습니다:  

입력:   This company’s <mstrans:dictionary translation=”akcje“>stock</mstrans:dictionary> is cheap.  
축어 사전:   akcje 견고함 jest tani.  
신경 사전:   Akcje 견고함 tanie.   

신경망 사전은 요청된 용어의 번역이 기본 문법 형태로 제공되기를 기대합니다. 여러 단어로 이루어진 용어도 지원되며 명사 구문으로 제공되어야 합니다. 즉, 단어가 독립적으로 레마타이징되어서는 안 됩니다(예: "에스토니아 의회 선거"가 "에스토니아 의회 선거"보다 더 낫습니다). 

신경 사전을 활성화하는 방법 

위에 나열된 모든 지원 언어에 대해 사용자 지정 번역기 플랫폼을 사용하는 모든 고객은 다음과 같이 신경망 사전을 즉시 사용할 수 있습니다. 구문 사전. 신경 사전을 사용하려면 전체(또는 사전만 해당) 사용자 지정 모델 재교육이 필요합니다. 

 권장 사항 

  1. 신경망 사전으로 작업할 때 구문 사전 항목이 더 자주 사용되도록 하려면 다양한 형태로 소스 부분과 함께 구문 항목을 추가하는 것을 고려할 수 있습니다. 위의 예에서 '솔루션 _' 옆에 '솔루션 _'을 추가할 수 있습니다. 대안"에 다음 항목도 추가할 수 있습니다: "솔루션 _ 대안", "솔루션 _ 대안", "솔루션 _ 대안".  
  2. 구문 사전을 사용할 때 특정 단어나 구문이 입력 텍스트에서 출력 번역으로 '있는 그대로' 복사되도록 하는 것이 목표인 경우, 축어 사전을 적용하는 것이 더 일관성이 있을 수 있으므로 축어 사전을 적용하는 것을 고려하세요.   
  3. 구문 사전에 흔하거나 자주 사용되는 단어나 구의 번역을 추가하지 마세요.  

사용자 지정 번역기에 대해 자세히 알아보고 글로벌 시장에서 비즈니스를 성공시키는 데 어떻게 도움이 되는지 알아보려면 먼저 사용자 지정 번역기 초보자 가이드. 

Microsoft 사용자 지정 번역기로 수행할 수 있는 일 

도메인별 용어를 사용하여 사용자 지정 모델을 만들고 마이크로 소프트 번역기 API. 

사용 Microsoft 사용자 지정 번역기 번역 솔루션으로 비즈니스를 글로벌화하고 고객과의 상호 작용을 개선할 수 있습니다. 

자세한 내용은 다음을 참조하세요. Microsoft 번역기 비즈니스 솔루션 그리고 사용자 지정 번역기 릴리스 노트.