รวมการแปลคำพูดตั้งแต่ต้นจนจบลงในผลิตภัณฑ์ของคุณด้วยบริการเสียงพูดของ Microsoft
บริการคำพูดของ Microsoft ในขณะนี้อยู่ในความพร้อมใช้งานทั่วไป ส่วนหนึ่งของบริการองค์ความรู้ Azure, เสียงพูดมีความสามารถในการพูดที่สมบูรณ์รวมทั้งการรู้จำเสียงการแปลและการอ่านออกเสียงการอ่านออกมาในชุดของบริการแบบครบวงจรและปรับแต่งได้ ซึ่งจะรวมความสามารถของ API เสียงพูดแปลของ Microsoft ที่มีอยู่, API ของ Bing Speech และบริการคำพูดที่กำหนดเอง (ตัวอย่าง)
คำพูดเป็นองค์กรพร้อมและปรับขนาดได้ตามความต้องการของคุณตั้งแต่ต้นแบบไปจนถึงการผลิต คุณสามารถเพิ่มแอปเว็บไซต์และเวิร์กโฟลว์ของคุณผ่านทาง Azure บอก รับ เป็น สมาชิก
คำพูดสนับสนุนภาษาการแปล11คำพูดเป็นคำพูด คำพูดจากทั้ง11ภาษายังสามารถแปลเป็นภาษาที่มีข้อความมากกว่า๖๐ รายการภาษาที่สนับสนุนสำหรับการแปลการรู้จำเสียงและการแปลงข้อความเป็นคำพูดสามารถพบได้ใน เอกสารบริการคำพูด.
โซลูชันแบบ end-to-end ที่ปรับแต่งได้
ในทำนองเดียวกันกับ API คำพูดของ Microsoft แปลบริการการแปลคำพูดรวมองค์ประกอบทั้งหมดที่จำเป็นสำหรับการแปลคำพูดในบริการแบบบูรณาการหนึ่ง: การรู้จำเสียงรวมถึงการฟื้นฟูข้อความ TrueText, การแปลข้อความผ่าน บริการตัวแปลของ Microsoft และการแปลงข้อความเป็นคำพูด
นอกจากนี้การแปลคำพูดจะสามารถกำหนดเองได้ในแต่ละระดับจากการรู้จำเสียงอินพุตเพื่อแปลข้อความเป็นคำพูด
การรู้จำเสียงและการฟื้นฟู TrueText: แปลงเสียงเสียงพูดเป็นข้อความ
เสียงคำพูดถูกประมวลผลและแปลงเป็นเอาต์พุตข้อความดิบ หลังจากที่มีการแปลงคำพูด TrueText normalizes ข้อความที่จะทำให้มันเหมาะสมมากขึ้นสำหรับการแปล TrueText จะเอาการยกเลิกคำพูด (คำฟิลเลอร์เช่น "um" s และ "ah-me") stutters และการซ้ำ นอกจากนี้ยังสามารถอ่านข้อความได้มากขึ้นโดยการเพิ่มตัวแบ่งประโยคเครื่องหมายวรรคตอนที่เหมาะสมและตัวพิมพ์ใหญ่
สามารถปรับแต่งการรู้จำเสียงโดยใช้ คำพูดที่กำหนดเอง. ด้วยคำพูดที่กำหนดเองผู้ใช้สามารถสร้างรูปแบบภาษาที่กำหนดเองที่ปรับแต่งตามคำศัพท์ของตัวเองและรูปแบบการพูดที่ไม่ซ้ำกัน รุ่นอะคูสติกที่กำหนดเองยังสามารถสร้างขึ้นเพื่อปรับให้เข้ากับสภาพแวดล้อมของผู้ใช้เพื่อให้แน่ใจว่าการรู้จำเสียงสามารถปรับให้เข้ากับไมโครโฟนต่างๆอัตราการสุ่มตัวอย่างหรือเสียงรบกวนพื้นหลัง
การแปลภาษาด้วยเครื่อง: แปลข้อความ
ข้อความที่แปลงแล้วจะถูกแปลโดยใช้เครื่องมือระบบประสาทแปลที่พัฒนาขึ้นเป็นพิเศษสำหรับชีวิตจริงสนทนาพูด.
นักแปลที่กำหนดเอง แสดงตัวอย่าง ช่วยให้ผู้ใช้สามารถปรับแต่งระบบประสาทแปลของนักแปลเป็นหนึ่งที่เข้าใจคำศัพท์ที่ใช้ในบริษัทหรืออุตสาหกรรม
ระบบที่กำหนดเองด้วยตัวแปลที่กำหนดเองสามารถใช้ได้ทั้งการแปลคำพูดและการแปลข้อความโดยใช้ API ข้อความของนักแปลไมโครซอฟท์.
การแปลงข้อความเป็นคำพูด: ผลิตเสียงจากข้อความที่แปล
การแปลงข้อความเป็นคำพูดหรือการสังเคราะห์เสียงจะสร้างเอาต์พุตเสียงที่สร้างขึ้นโดยคอมพิวเตอร์จากข้อความที่แปล ผู้ใช้สามารถเลือกได้มากกว่า๗๕เสียงมากกว่า๔๕ภาษาหรือตำแหน่งที่อยู่รวมทั้งตัวเลือกสำหรับเสียงชายและหญิง
กับ เสียงที่กำหนดเองผู้ใช้ยังสามารถปรับแต่งเสียงโดยการบันทึกและอัปโหลดข้อมูลการฝึกอบรม บริการสร้างเสียงที่ไม่ซ้ำกันในการบันทึกของคุณ
เริ่มต้นใช้งานการพูดแบบรวม
เรียนรู้เพิ่มเติมเกี่ยวกับการพูดแบบครบวงจรบนบริการ หน้า Azure. นอกจากนี้คุณยังสามารถทดสอบบริการการพูดที่เป็นศูนย์รวมของ Microsoft ฟรีด้วยคีย์ทดลองใช้30วันผ่าน พอร์ทัล Azure.
เอกสารสำหรับเสียงพูดสามารถใช้ได้ ที่นี่, และเต็มไปด้วยการเริ่มต้นอย่างรวดเร็ว, บทเรียน, และวิธีการแนะนำที่จะช่วยให้คุณเพิ่มบริการใน app ของคุณ.