ลองใช้ SeamlessM4T วุ้นแปลภาษาพลังเอไอของ Meta รองรับเกือบ 100 ภาษา  แปลได้แม้มี 2 ภาษาในประโยคเดียวแบบไร้รอยต่อ

  • 1
  •  
  •  
  •  
  •  

ปัจจุบันนี้โลกเชื่อมต่อกันมากขึ้นด้วยเทคโนโลยีอย่าง อินเตอร์เน็ต, สมาร์ทโฟน, สื่อสังคมออนไลน์ แพลทฟอร์มการสื่อสารต่างๆทำให้ผู้คนเข้าถึงข้อมูลและเนื้อหาในภาษาต่างๆได้เพิ่มมากกว่าที่เคยเป็นมา นั่นทำให้ความต้องการสื่อสารและเข้าใจข้อมูลในภาษาต่างย่อมมีมากขึ้น

เครื่องมือที่จะทำลายกำแพงภาษาที่ทำได้ทั้งการแปล “เสียงพูด” หรือ “ข้อความ” ในภาษาหนึ่งไปสู่ “เสียงพูด” หรือ “ข้อความ” ในอีกภาษาหนึ่งสามารถรับรู้ภาษาต้นทางได้โดยอัตโนมัติแม้จะพูด 2 ภาษาไปพร้อมๆกันได้ และทำได้อย่างรวดเร็วและไร้รอยต่อนั้นในอดีตอาจจะเป็นสิ่งที่มีแต่ในนิยายไซไฟหรือในการ์ตูนเท่านั้น แต่ปัจจุบันด้วยเทคโนโลยี AI ที่ก้าวหน้าไปมากทำให้ วุ่นแปลภาษาเป็นไปได้แล้วด้วยผลงาน SeamlessM4T ที่ Meta เพิ่งเปิดตัวออกมาและเปิดให้ลองใช้กันแล้ว

SeamlessM4T คืออะไร?

SeamlessM4T นั้นเป็นโปรเจ็กต์ของ Meta ที่มีเป้าหมายเพื่อสร้าง วุ้นแปลภาษาแบบครอบจักวาลโดย SeamlessM4T ทาง Meta บอกว่าเป็น first all-in-one multilingual multimodal AI translation and transcription model คือโปรแกรม “แปลภาษาและถอดความ” ที่ทำงานด้วย AI ที่ถูกเทรนมาหลายโมเดลและมีความสามารถที่หลากหลายสามารถทำงานได้อย่างไร้รอยต่อไม่ว่าจะเป็น

  1. สามารถรับรู้เสียงได้เกือบ 100 ภาษา
  2. แปลภาษาจากเสียงพูดเป็นข้อความได้เกือบ 100 ภาษา
  3. แปลเสียงพูดเป็นเสียงพูด รองรับภาษา input เกือบ 100 ภาษา และ output 36 ภาษา (มีภาษาอังกฤษ) 4.แปลข้อความเป็นข้อความได้เกือบ 100 ภาษา
  4. แปลข้อความเป็นเสียงพูด รองรับภาษา input เกือบ 100 ภาษา และภาษา output 35 ภาษา (มีภาษาอังกฤษ)

นอกจากจะสามารถรับรู้ภาษาต่างๆได้จากเสียงพูดและข้อความโดยอัตโนมัติแล้วการรับรู้ภาษาของ SeamlessM4T ยังพัฒนาไปอีกระดับโดยสามารถรับรู้ภาษาที่พูดออกมาได้มากกว่า 1 ภาษาและสามารถแปลภาษาเหล่านั้นได้

การเปิดตัว SeamlessM4T ครั้งนี้ของ Meta เป็นการเผยแพร่เพื่อให้นักวิจัยและนักพัฒนานำไปศึกษาและพัฒนาต่อไปได้และยังเปิดเผย metadata ของ SeamlessAlign ที่เป็น dataset ของการแปลจาก เสียงพูดไปเป็นข้อความให้นำไปพัฒนาต่อด้วยเช่นกัน

ประโยชน์ของ SeamlessM4T

ด้วยความสามารถของ SeamlessM4T ในอนาคตจะช่วยให้คนไทยสื่อสารกับคนชาติต่างๆได้ด้วยเสียงพูดเช่นให้ SeamlessM4T แปลเสียงพูดภาษาไทยของเราไปเป็นเสียงพูดภาษาอื่นๆได้อีก 36 ภาษาอย่างแม่นยำ หรือหากให้แปลเป็นข้อความก็ทำได้มากถึง 100 ภาษา

ในทางกลับกัน SeamlessM4T ก็สามารถแปลภาษาอื่นๆเกือบ 100 ภาษาของชาวต่างชาติเป็นเสียงพูดหรือข้อความภาษาไทยได้อย่างรวดเร็วเช่นกัน เทคโนโลยีนี้น่าจะมีประโยชน์กับการสื่อสารระหว่างคนต่างชาติต่างภาษา รวมถึงสามารถใช้ในการสื่อสารในองค์กรที่มีคนต่างชาติต่างภาษาอยู่ร่วมกันได้ และที่สำคัญอาจเป็นเทคโนโลยีที่ทำลายกำแพงภาษาที่ทำให้คนไทยเข้าถึงคอนเทนต์จำนวนมหาศาลในภาษาต่างๆทั่วโลกได้อย่างอิสระต่อไปในอนาคต

ลองใช้ SeamlessM4T ตัวเดโม่

Meta เปิดให้ทดลองใช้ SeamlessM4T ตัวเดโม่ที่สามารถใช้งานแปล input ด้วย “เสียงพูด” ไปสู่ “ข้อความ” และ “เสียง” ในอีก 3 ภาษาได้ในทันทีโดยสามารถเข้าไปทดลองใช้ได้ที่ Link

หลังจากกดลิงค์เข้าไปจะพบกับหน้าแรกที่มีปุ่มให้อัดเสียงพูดเข้าไป

เมื่อกด Start Recording แล้วระบบจะอัดเสียงของเราโดยเสียงของเราจะเข้าไปอยู่ใน Record Input ที่สามารถกดฟังได้หรือจะกดอัดใหม่อีกครั้งได้ในการทดสอบผมลองพูดภาษาไทยว่า “เมนูนี้ราคาเท่าไหร่ มีเมนูอื่นแนะนำไหมครับ” ส่วนด้านล่างเราสามารถเลือกภาษาที่ต้องการให้แปลออกเป็น Output ได้ 3 ภาษาด้วยกันในที่นี้ลองเลือก ภาษาอังกฤษ ภาษาฝรั่งเศส และภาษาญี่ปุ่นแล้วกด Translate

หลังจากกด Translate ระบบจะรับรู้ภาษาที่เราพูดว่าเป็น ภาษาไทย โดยอัตโนมัติ และแปลเป็น Text ทั้ง 3 ภาษา และสร้างเสียงออกมาเป็น 3 ภาษาให้เราเลือกกดฟังได้ภายในระยะเวลาไม่กี่วินาทีเท่านั้น

นี่คือความมหัศจรรย์ของการแปลด้วยพลัง AI ที่ถูกเทรนมาจากหลากหลายโมเดลภาษาและนำมาเชื่อมต่อเป็น application เดียวที่ใช้งานได้อย่างไร้รอยต่อ ซึ่งจากนี้ก็ต้องจับตากันต่อไปว่า SeamlessM4T จะถูกพัฒนาไปอยู่ในระดับไหนและจะถูกนำไปใช้ในเชิงพาณิชย์อย่างไรต่อไป


  • 1
  •  
  •  
  •  
  •