ปัจจุบันนี้โลกเชื่อมต่อกันมากขึ้นด้วยเทคโนโลยีอย่าง อินเตอร์เน็ต, สมาร์ทโฟน, สื่อสังคมออนไลน์ แพลทฟอร์มการสื่อสารต่างๆทำให้ผู้คนเข้าถึงข้อมูลและเนื้อหาในภาษาต่างๆได้เพิ่มมากกว่าที่เคยเป็นมา นั่นทำให้ความต้องการสื่อสารและเข้าใจข้อมูลในภาษาต่างย่อมมีมากขึ้น
เครื่องมือที่จะทำลายกำแพงภาษาที่ทำได้ทั้งการแปล “เสียงพูด” หรือ “ข้อความ” ในภาษาหนึ่งไปสู่ “เสียงพูด” หรือ “ข้อความ” ในอีกภาษาหนึ่งสามารถรับรู้ภาษาต้นทางได้โดยอัตโนมัติแม้จะพูด 2 ภาษาไปพร้อมๆกันได้ และทำได้อย่างรวดเร็วและไร้รอยต่อนั้นในอดีตอาจจะเป็นสิ่งที่มีแต่ในนิยายไซไฟหรือในการ์ตูนเท่านั้น แต่ปัจจุบันด้วยเทคโนโลยี AI ที่ก้าวหน้าไปมากทำให้ วุ่นแปลภาษาเป็นไปได้แล้วด้วยผลงาน SeamlessM4T ที่ Meta เพิ่งเปิดตัวออกมาและเปิดให้ลองใช้กันแล้ว
SeamlessM4T คืออะไร?
SeamlessM4T นั้นเป็นโปรเจ็กต์ของ Meta ที่มีเป้าหมายเพื่อสร้าง วุ้นแปลภาษาแบบครอบจักวาลโดย SeamlessM4T ทาง Meta บอกว่าเป็น first all-in-one multilingual multimodal AI translation and transcription model คือโปรแกรม “แปลภาษาและถอดความ” ที่ทำงานด้วย AI ที่ถูกเทรนมาหลายโมเดลและมีความสามารถที่หลากหลายสามารถทำงานได้อย่างไร้รอยต่อไม่ว่าจะเป็น
- สามารถรับรู้เสียงได้เกือบ 100 ภาษา
- แปลภาษาจากเสียงพูดเป็นข้อความได้เกือบ 100 ภาษา
- แปลเสียงพูดเป็นเสียงพูด รองรับภาษา input เกือบ 100 ภาษา และ output 36 ภาษา (มีภาษาอังกฤษ) 4.แปลข้อความเป็นข้อความได้เกือบ 100 ภาษา
- แปลข้อความเป็นเสียงพูด รองรับภาษา input เกือบ 100 ภาษา และภาษา output 35 ภาษา (มีภาษาอังกฤษ)
นอกจากจะสามารถรับรู้ภาษาต่างๆได้จากเสียงพูดและข้อความโดยอัตโนมัติแล้วการรับรู้ภาษาของ SeamlessM4T ยังพัฒนาไปอีกระดับโดยสามารถรับรู้ภาษาที่พูดออกมาได้มากกว่า 1 ภาษาและสามารถแปลภาษาเหล่านั้นได้
การเปิดตัว SeamlessM4T ครั้งนี้ของ Meta เป็นการเผยแพร่เพื่อให้นักวิจัยและนักพัฒนานำไปศึกษาและพัฒนาต่อไปได้และยังเปิดเผย metadata ของ SeamlessAlign ที่เป็น dataset ของการแปลจาก เสียงพูดไปเป็นข้อความให้นำไปพัฒนาต่อด้วยเช่นกัน
ประโยชน์ของ SeamlessM4T
ด้วยความสามารถของ SeamlessM4T ในอนาคตจะช่วยให้คนไทยสื่อสารกับคนชาติต่างๆได้ด้วยเสียงพูดเช่นให้ SeamlessM4T แปลเสียงพูดภาษาไทยของเราไปเป็นเสียงพูดภาษาอื่นๆได้อีก 36 ภาษาอย่างแม่นยำ หรือหากให้แปลเป็นข้อความก็ทำได้มากถึง 100 ภาษา
ในทางกลับกัน SeamlessM4T ก็สามารถแปลภาษาอื่นๆเกือบ 100 ภาษาของชาวต่างชาติเป็นเสียงพูดหรือข้อความภาษาไทยได้อย่างรวดเร็วเช่นกัน เทคโนโลยีนี้น่าจะมีประโยชน์กับการสื่อสารระหว่างคนต่างชาติต่างภาษา รวมถึงสามารถใช้ในการสื่อสารในองค์กรที่มีคนต่างชาติต่างภาษาอยู่ร่วมกันได้ และที่สำคัญอาจเป็นเทคโนโลยีที่ทำลายกำแพงภาษาที่ทำให้คนไทยเข้าถึงคอนเทนต์จำนวนมหาศาลในภาษาต่างๆทั่วโลกได้อย่างอิสระต่อไปในอนาคต
ลองใช้ SeamlessM4T ตัวเดโม่
Meta เปิดให้ทดลองใช้ SeamlessM4T ตัวเดโม่ที่สามารถใช้งานแปล input ด้วย “เสียงพูด” ไปสู่ “ข้อความ” และ “เสียง” ในอีก 3 ภาษาได้ในทันทีโดยสามารถเข้าไปทดลองใช้ได้ที่ Link
หลังจากกดลิงค์เข้าไปจะพบกับหน้าแรกที่มีปุ่มให้อัดเสียงพูดเข้าไป
เมื่อกด Start Recording แล้วระบบจะอัดเสียงของเราโดยเสียงของเราจะเข้าไปอยู่ใน Record Input ที่สามารถกดฟังได้หรือจะกดอัดใหม่อีกครั้งได้ในการทดสอบผมลองพูดภาษาไทยว่า “เมนูนี้ราคาเท่าไหร่ มีเมนูอื่นแนะนำไหมครับ” ส่วนด้านล่างเราสามารถเลือกภาษาที่ต้องการให้แปลออกเป็น Output ได้ 3 ภาษาด้วยกันในที่นี้ลองเลือก ภาษาอังกฤษ ภาษาฝรั่งเศส และภาษาญี่ปุ่นแล้วกด Translate
หลังจากกด Translate ระบบจะรับรู้ภาษาที่เราพูดว่าเป็น ภาษาไทย โดยอัตโนมัติ และแปลเป็น Text ทั้ง 3 ภาษา และสร้างเสียงออกมาเป็น 3 ภาษาให้เราเลือกกดฟังได้ภายในระยะเวลาไม่กี่วินาทีเท่านั้น
นี่คือความมหัศจรรย์ของการแปลด้วยพลัง AI ที่ถูกเทรนมาจากหลากหลายโมเดลภาษาและนำมาเชื่อมต่อเป็น application เดียวที่ใช้งานได้อย่างไร้รอยต่อ ซึ่งจากนี้ก็ต้องจับตากันต่อไปว่า SeamlessM4T จะถูกพัฒนาไปอยู่ในระดับไหนและจะถูกนำไปใช้ในเชิงพาณิชย์อย่างไรต่อไป