بالإلى الحلوة والخاصة
Translator
تمت ترجمة هذه الصفحة تلقائيًا بواسطة خدمة الترجمة الآلية الخاصة بـ Microsoft Translator. التعرف على المزيد

مايكروسوفت المترجم مدونه

الاحصائيه اله الترجمة – بلوق الضيف (تحديث مع ورقه اضافيه)

وسوف لويس هو مدير البرنامج علي فريق مترجم مايكروسوفت, العمل علي جوده اللغة والحصول علي البيانات.  بلوق الضيف اليوم هو شرح علي مستوي عال من كيفيه عمل المحرك:  

كما يعلم العديد منكم ، تحت غطاء محرك المحرك يتم تشغيل مترجم Microsoft بواسطة مشغل الترجمة اليه الاحصائيه (SMT).  وتختلف النظم الاحصائيه عن الانظمه القائمة علي القواعد من حيث ان النظام لا يتعلم الكلمات والعبارات التي ترسم من لغة إلى أخرى ولا يتم ترميزها يدويا.  تدريب SMT يتطلب جمع كميه كبيره من البيانات التدريبية الموازية-نامل من نوعيه جيده ومن مصادر غير متجانسة-وتدريب المحرك علي تلك البيانات.  (بالتوازي ، نعني مصدرا للبيانات حيث يكون محتوي لغة واحده هو نفس المحتوي الخاص بالأخر.)  يتعلم المحرك المراسلات بين الكلمات والعبارات بلغه واحده وتلك الموجودة في لغة أخرى ، والتي غالبا ما يتم تعزيزها بتكرارات متكررة لنفس الكلمات والعبارات خلال الإدخال.  علي سبيل المثال ، في تدريب النظام الانجليزيه-المانيه دعوانا نقول ، إذا كان المحرك يري العبارة جميع الحقوق محفوظه علي الجانب الإنجليزي وإشعارات أيضا سالي ريتشتي فوربيهلتن علي الجانب ألماني ، فانه قد محاذاة هذه العبارات اثنين ، وتعيين بعض الاحتمالات لهذه المحاذاة.  التكرارات المتكررة للعبارات المصدر والهدف في بيانات التدريب ستعزز هذه المحاذاة فقط.

عموما ، وجود بيانات موازيه لزوج اللغة يعني اننا يمكن ان تدرب المحركات في كلا الاتجاهين (اي ، كل من اللغة الانجليزيه-المانيه والمانيه-الانجليزيه يمكن تدريب الانظمه علي نفس الجمل الإدخال).  بعض منكم كان لديه بعض الاسئله حول لماذا كان ان أصدرنا النظام الانجليزيه-الاسبانيه قبل ان أصدرنا الاسبانيه والانجليزيه.  كان هناك حقا سببين.  أولا ، كان الانجليزيه-الاسبانيه أول زوج اللغة المجال العام أصدرنا.  الإفراج عن زوج واحد اللغة يسمح لنا لاختبار البنية التحتية قبل ان نبدا الإفراج عن أكثر من ذلك.  ثانيا ، كانت التكنولوجيا الاسبانيه والانجليزيه مختلفه قليلا عن تلك المستخدمة في اللغة الانجليزيه-الاسبانيه ، ونحن بحاجه إلى بعض الوقت الإضافي للقيام بالتغييرات اللازمة البنية التحتية لاستيعاب.  في المستقبل ، ونحن نخطط للإفراج عن أنظمه الترجمة الجديدة في أزواج (مع اثنين من الاستثناءات).  لا أستطيع الكشف عن اللغات التي خططنا لها بعد ذلك ، ولكن هل نتوقع بعض جديده قريبا!

بالنسبة لأولئك منكم المهتمين في المناقشات الفنية بشان محركاتنا وكيفيه عملها ، يرجى الرجوع إلى بعض الأوراق من قبل الباحثين الذين طورواها.  وهناك ثلاث ورقات حديثه للمذكرة هي:

كريس كويرك ، ارول مينزيس. هل نحن بحاجه إلى عبارات ؟ تحدي الحكمة التقليدية في الترجمة اليه الاحصائيه شهر ماي 2006 نيويورك, نيويورك, [اوسا] وقائع التمرين-naacl 2006

كريس كويرك ، ارول مينزيس. التبعية treelet الترجمة: تقارب الاحصائيه والترجمة اليه علي سبيل المثال ؟ مارس 2006 الترجمة اليه 43-65 (ملف مرفق)


كريس كويرك ، ارول مينزيس. استخدام قوالب ترتيب التبعية لتحسين العمومية في الترجمة 2007 تموز/يوليه جمعيه اللغويات الحاسوبية

التبعية treelet الترجمة التقارب بين الترجمة الاحصائيه وآلات القائمة علي الامثله. pdf