Interpret เป นต วแปรท ม ล กษณะอย างไร

ในการแปลภาษาด้วยเครื่อง ข้อความหรือภาษาดั้งเดิมจะถูกเรียกว่าภาษาต้นฉบับ ส่วนภาษาที่ต้องการคำแปลจะเรียกว่าภาษาเป้าหมาย การแปลภาษาด้วยเครื่องทำงานด้วบกระบวนการพื้นฐานสองขั้นตอนดังต่อไปนี้

  1. ถอดรหัสความหมายในภาษาต้นฉบับของข้อความต้นฉบับ
  2. เข้ารหัสความหมายเป็นภาษาเป้าหมาย

แนวทางพื้นฐานบางอย่างที่เทคโนโลยีการแปลภาษานำกระบวนการแปลภาษาด้วยเครื่องไปใช้มีดังนี้

การแปลภาษาด้วยเครื่องตามกฎ

ผู้เชี่ยวชาญด้านภาษาได้พัฒนากฎทางภาษาศาสตร์ในตัวและพจนานุกรมสองภาษาสำหรับอุตสาหกรรมหรือหัวข้อที่เฉพาะเจาะจง การแปลภาษาด้วยเครื่องตามกฎจะใช้พจนานุกรมเหล่านี้เพื่อแปลเนื้อหาที่เฉพาะเจาะจงอย่างแม่นยำ ขั้นตอนของกระบวนการมีดังนี้

  1. ซอฟต์แวร์การแปลภาษาด้วยเครื่องจะแยกวิเคราะห์ข้อความอินพุตและสร้างการแสดงข้อมูลแบบเปลี่ยนผ่าน
  2. แล้วแปลงข้อมูลที่แสดงเป็นภาษาเป้าหมายโดยอ้างอิงกฎไวยากรณ์และพจนานุกรม

ข้อดีและข้อเสีย

การแปลภาษาด้วยเครื่องตามกฎสามารถปรับแต่งตามอุตสาหกรรมหรือหัวข้อที่เฉพาะเจาะจงได้ มีผลลัพธ์ที่คาดการณ์ได้และให้คำแปลที่มีคุณภาพ อย่างไรก็ตาม หากข้อความต้นฉบับมีคุณภาพต่ำหรือไม่ได้ใช้คำที่ปรากฏในพจนานุกรมในตัว ผลลัพธ์ก็จะออกมาไม่ดี วิธีการปรับปรุงเพียงวิธีเดียวคือการอัปเดตพจนานุกรมด้วยตนเองเป็นประจำ

การแปลภาษาด้วยเครื่องตามสถิติ

การแปลภาษาด้วยเครื่องตามสถิติจะใช้ Machine Learning ในการแปลภาษาของข้อความ แทนการใช้กฎทางภาษาศาสตร์ อัลกอริทึมของ Machine Learning จะวิเคราะห์คำแปลจำนวนมากที่มีอยู่แล้วของมนุษย์ และมองหารูปแบบทางสถิติ จากนั้นซอฟต์แวร์จะใช้ทำการคาดเดาอย่างชาญฉลาดเมื่อได้รับคำขอให้แปลข้อความต้นฉบับใหม่ โดยการคาดเดาจะอยู่บนพื้นฐานของความเป็นไปได้ทางสถิติที่คำหรือวลีหนึ่งจะปรากฏร่วมกับคำหรือวลีอื่นในภาษาเป้าหมาย

การแปลภาษาด้วยเครื่องตามไวยากรณ์

การแปลภาษาด้วยเครื่องตามไวยากรณ์เป็นหมวดหมู่ย่อยของการแปลภาษาด้วยเครื่องตามสถิติ โดยจะมีการใช้กฎไวยากรณ์เพื่อแปลหน่วยวากยสัมพันธ์ต่างๆ และวิเคราะห์ประโยคเพื่อรวมกฎไวยากรณ์เข้ากับรูปแบบการแปลตามสถิติ

ข้อดีและข้อเสีย

แนวทางการใช้สถิติจำเป็นต้องมีการฝึกฝนกับคำหลายล้านคำในทุกคู่ภาษา อย่างไรก็ตาม การแปลภาษาด้วยเครื่องจะแม่นยำเมื่อมีข้อมูลจำนวนมากพอ

การแปลภาษาด้วยเครื่องแบบนิวรัล

การแปลภาษาด้วยเครื่องแบบนิวรัลจะใช้ปัญญาประดิษฐ์ในการเรียนรู้ภาษาและปรับปรุงความรู้ดังกล่าวอย่างต่อเนื่อง โดยใช้วิธีการเรียนรู้ที่เจาะจงของ Machine Learning ซึ่งเรียกว่านิวรัลเน็ตเวิร์ก และมักจะทำงานร่วมกับวิธีการแปลภาษาตามสถิติ

นิวรัลเน็ตเวิร์ก

นิวรัลเน็ตเวิร์กเป็นชุดโหนดที่เชื่อมต่อถึงกันซึ่งได้แรงบันดาลใจมาจากสมองของมนุษย์ เป็นระบบข้อมูลที่ให้ข้อมูลอินพุตวิ่งผ่านโหนดต่างๆ ที่เชื่อมต่อกันเพื่อสร้างเอาต์พุต ซอฟต์แวร์การแปลภาษาด้วยเครื่องแบบนิวรัลจะใช้นิวรัลเน็ตเวิร์กเพื่อทำงานกับชุดข้อมูลขนาดใหญ่ แต่ละโหนดจะสร้างการเปลี่ยนแปลงหนึ่งอย่างต่อข้อความต้นฉบับไปเรื่อยๆ จนกระทั่งโหนดเอาต์พุตแสดงผลลัพธ์สุดท้ายออกมา

การแปลภาษาด้วยเครื่องแบบนิวรัลเทียบกับวิธีการแปลรูปแบบอื่น

นิวรัลเน็ตเวิร์กจะพิจารณาประโยคอินพุตทั้งประโยคในแต่ละขั้นตอนเมื่อสร้างประโยคเอาต์พุต แต่รูปแบบการแปลภาษาด้วยเครื่องอื่นๆ จะแบ่งประโยคอินพุตออกเป็นชุดของคำและวลี จากนั้นจึงจับคู่กับคำหรือประโยคในภาษาเป้าหมาย ระบบการแปลภาษาด้วยเครื่องแบบนิวรัลสามารถจัดการกับข้อจำกัดมากมายที่รูปแบบอื่นๆ พบเจอและมักจะสร้างคำแปลที่มีคุณภาพดีกว่า

การแปลภาษาด้วยเครื่องแบบไฮบริด

เครื่องมือการแปลภาษาด้วยเครื่องแบบไฮบริดใช้รูปแบบการแปลภาษาด้วยเครื่องตั้งแต่ 2 รูปแบบขึ้นไปในซอฟต์แวร์หนึ่งรายการ คุณสามารถใช้วิธีไฮบริดเพื่อปรับปรุงประสิทธิภาพของการแปลภาษารูปแบบเดียว โดยทั่วไป กระบวนการแปลภาษาด้วยเครื่องนี้จะใช้ระบบย่อยของการแปลภาษาด้วยเครื่องตามกฎและสถิติ ผลลัพธ์ขั้นสุดท้ายของการแปลจึงเป็นการนำเอาต์พุตของระบบย่อยทั้งหมดมารวมกัน

ข้อดีและข้อเสีย

รูปแบบการแปลภาษาด้วยเครื่องแบบไฮบริดปรับปรุงคุณภาพการแปลได้สำเร็จ โดยก้าวข้ามปัญหาที่เกี่ยวข้องกับการแปลด้วยวิธีเดียว