ในการแปลภาษาด้วยเครื่อง ข้อความหรือภาษาดั้งเดิมจะถูกเรียกว่าภาษาต้นฉบับ ส่วนภาษาที่ต้องการคำแปลจะเรียกว่าภาษาเป้าหมาย การแปลภาษาด้วยเครื่องทำงานด้วบกระบวนการพื้นฐานสองขั้นตอนดังต่อไปนี้ Show
แนวทางพื้นฐานบางอย่างที่เทคโนโลยีการแปลภาษานำกระบวนการแปลภาษาด้วยเครื่องไปใช้มีดังนี้ การแปลภาษาด้วยเครื่องตามกฎผู้เชี่ยวชาญด้านภาษาได้พัฒนากฎทางภาษาศาสตร์ในตัวและพจนานุกรมสองภาษาสำหรับอุตสาหกรรมหรือหัวข้อที่เฉพาะเจาะจง การแปลภาษาด้วยเครื่องตามกฎจะใช้พจนานุกรมเหล่านี้เพื่อแปลเนื้อหาที่เฉพาะเจาะจงอย่างแม่นยำ ขั้นตอนของกระบวนการมีดังนี้
ข้อดีและข้อเสียการแปลภาษาด้วยเครื่องตามกฎสามารถปรับแต่งตามอุตสาหกรรมหรือหัวข้อที่เฉพาะเจาะจงได้ มีผลลัพธ์ที่คาดการณ์ได้และให้คำแปลที่มีคุณภาพ อย่างไรก็ตาม หากข้อความต้นฉบับมีคุณภาพต่ำหรือไม่ได้ใช้คำที่ปรากฏในพจนานุกรมในตัว ผลลัพธ์ก็จะออกมาไม่ดี วิธีการปรับปรุงเพียงวิธีเดียวคือการอัปเดตพจนานุกรมด้วยตนเองเป็นประจำ การแปลภาษาด้วยเครื่องตามสถิติการแปลภาษาด้วยเครื่องตามสถิติจะใช้ Machine Learning ในการแปลภาษาของข้อความ แทนการใช้กฎทางภาษาศาสตร์ อัลกอริทึมของ Machine Learning จะวิเคราะห์คำแปลจำนวนมากที่มีอยู่แล้วของมนุษย์ และมองหารูปแบบทางสถิติ จากนั้นซอฟต์แวร์จะใช้ทำการคาดเดาอย่างชาญฉลาดเมื่อได้รับคำขอให้แปลข้อความต้นฉบับใหม่ โดยการคาดเดาจะอยู่บนพื้นฐานของความเป็นไปได้ทางสถิติที่คำหรือวลีหนึ่งจะปรากฏร่วมกับคำหรือวลีอื่นในภาษาเป้าหมาย การแปลภาษาด้วยเครื่องตามไวยากรณ์การแปลภาษาด้วยเครื่องตามไวยากรณ์เป็นหมวดหมู่ย่อยของการแปลภาษาด้วยเครื่องตามสถิติ โดยจะมีการใช้กฎไวยากรณ์เพื่อแปลหน่วยวากยสัมพันธ์ต่างๆ และวิเคราะห์ประโยคเพื่อรวมกฎไวยากรณ์เข้ากับรูปแบบการแปลตามสถิติ ข้อดีและข้อเสียแนวทางการใช้สถิติจำเป็นต้องมีการฝึกฝนกับคำหลายล้านคำในทุกคู่ภาษา อย่างไรก็ตาม การแปลภาษาด้วยเครื่องจะแม่นยำเมื่อมีข้อมูลจำนวนมากพอ การแปลภาษาด้วยเครื่องแบบนิวรัลการแปลภาษาด้วยเครื่องแบบนิวรัลจะใช้ปัญญาประดิษฐ์ในการเรียนรู้ภาษาและปรับปรุงความรู้ดังกล่าวอย่างต่อเนื่อง โดยใช้วิธีการเรียนรู้ที่เจาะจงของ Machine Learning ซึ่งเรียกว่านิวรัลเน็ตเวิร์ก และมักจะทำงานร่วมกับวิธีการแปลภาษาตามสถิติ นิวรัลเน็ตเวิร์กนิวรัลเน็ตเวิร์กเป็นชุดโหนดที่เชื่อมต่อถึงกันซึ่งได้แรงบันดาลใจมาจากสมองของมนุษย์ เป็นระบบข้อมูลที่ให้ข้อมูลอินพุตวิ่งผ่านโหนดต่างๆ ที่เชื่อมต่อกันเพื่อสร้างเอาต์พุต ซอฟต์แวร์การแปลภาษาด้วยเครื่องแบบนิวรัลจะใช้นิวรัลเน็ตเวิร์กเพื่อทำงานกับชุดข้อมูลขนาดใหญ่ แต่ละโหนดจะสร้างการเปลี่ยนแปลงหนึ่งอย่างต่อข้อความต้นฉบับไปเรื่อยๆ จนกระทั่งโหนดเอาต์พุตแสดงผลลัพธ์สุดท้ายออกมา การแปลภาษาด้วยเครื่องแบบนิวรัลเทียบกับวิธีการแปลรูปแบบอื่นนิวรัลเน็ตเวิร์กจะพิจารณาประโยคอินพุตทั้งประโยคในแต่ละขั้นตอนเมื่อสร้างประโยคเอาต์พุต แต่รูปแบบการแปลภาษาด้วยเครื่องอื่นๆ จะแบ่งประโยคอินพุตออกเป็นชุดของคำและวลี จากนั้นจึงจับคู่กับคำหรือประโยคในภาษาเป้าหมาย ระบบการแปลภาษาด้วยเครื่องแบบนิวรัลสามารถจัดการกับข้อจำกัดมากมายที่รูปแบบอื่นๆ พบเจอและมักจะสร้างคำแปลที่มีคุณภาพดีกว่า การแปลภาษาด้วยเครื่องแบบไฮบริดเครื่องมือการแปลภาษาด้วยเครื่องแบบไฮบริดใช้รูปแบบการแปลภาษาด้วยเครื่องตั้งแต่ 2 รูปแบบขึ้นไปในซอฟต์แวร์หนึ่งรายการ คุณสามารถใช้วิธีไฮบริดเพื่อปรับปรุงประสิทธิภาพของการแปลภาษารูปแบบเดียว โดยทั่วไป กระบวนการแปลภาษาด้วยเครื่องนี้จะใช้ระบบย่อยของการแปลภาษาด้วยเครื่องตามกฎและสถิติ ผลลัพธ์ขั้นสุดท้ายของการแปลจึงเป็นการนำเอาต์พุตของระบบย่อยทั้งหมดมารวมกัน ข้อดีและข้อเสียรูปแบบการแปลภาษาด้วยเครื่องแบบไฮบริดปรับปรุงคุณภาพการแปลได้สำเร็จ โดยก้าวข้ามปัญหาที่เกี่ยวข้องกับการแปลด้วยวิธีเดียว |