ตลาด AI ร้อนแรง! สรุปไฮไลท์งาน Google I/O 2024 อัพเกรดพลัง AI ในหลายบริการกูเกิล

  • 7
  •  
  •  
  •  
  •  

เรียกว่าตลาด Artificial Intelligence (AI) กำลังร้อนเป็นไฟก็ว่าได้หลังจากยักษ์ใหญ่ด้าน AI เปิดตัวความสามารถใหม่ๆของ Generative AI ออกมาอย่างต่อเนื่องโดยเฉพาะสิ่งที่เรียกว่า Multimodal AI หรือ AI ที่มีความสามารถเข้าใจทั้ง Text, Vision และ Audio ได้พร้อมกันในที่เดียว หรือก็คือนอกจากจะเข้าใจภาษาที่เป็นตัวหนังสือแล้ว ยังสามารถเข้าใจจากภาพนิ่งและวิดีโอ และแสดงออกทางอารมณ์ผ่านเสียงเหมือนมนุษย์จริงๆได้ด้วย ซึ่งที่สร้างความฮือฮาอย่างมากก็คือ ChatGPT โมเดลใหม่ที่เรียกว่า GPT-4o ที่เปิดตัวไปเมื่อวันที่ 13 พฤษภาคมที่ผ่านมา

อย่างไรก็ตามล่าสุด Google เองก็ไม่น้อยหน้า เปิดตัวบริการที่อัพเกรดด้วยพลัง AI ออกมาหลากหลายบริการในงาน Google I/O 2024 อีก 1 วันถัดมาทันที โดยมี AI เข้าไปขับเคลื่อนตั้งแต่ระบบ Search Engine ระบบ AI Chat ในโปรแกรมการทำงาน รวมถึงบริการ AI อื่นๆ ที่อยู่ระหว่างพัฒนาเช่น AI สร้างวิดีโอ ผู้ช่วย AI ที่ฉลาดขึ้นอย่างมาก และทั้งหมดนี้คือสรุปไฮไลท์สำคัญในงาน Google I/O 2024

อัพเกรด Gemini ให้เก่งขึ้นอีก

Sundar Pichai ซีอีโอ Google เปิดเผยในงานว่า Gemini ได้พัฒนาขึ้นไปอีกระดับสู่ Gemini 1.5 Pro ที่จะทำให้ Gemini สามารถสรุปข้อมูลได้มากขึ้นระหับ 2 ล้าน token หรือเทียบได้กับการสรุปข้อมูล Text ความยาว 1,500 หน้าได้แล้ว

นอกจากนี้ยังเปิดตัว Gemini 1.5 Flash โมเดลเวอร์ชั่นเล็กเบาและเร็วที่ช่วยให้ประหยัดค่าใช้จ่ายมากกว่า ออกแบบมาเพื่อรองรับงานเล็กๆเช่นการสรุปบทสนทนา บรรยายรูปภาพหรือวิดีโอ และการดึงข้อมูลจากเอกสารใหญ่ๆที่เปิดให้นักพัฒนาสามารถดึงไปใช้ได้

ซีอีโอ Google เปิดเผยด้วยว่า Gemini จะยกระดับความสามารถในการแปลให้เก่งขึ้นไปอีกและจะเปิดให้นักพัฒนาทั่วโลกนำไปใช้ได้ใน 35 ภาษา นอกจากนี้ในแอป Gmail จะติดตั้ง Gemini 1.5 Pro เข้าไปช่วยวิเคราะห์ไฟล์ PDF รวมถึง วิดีโอที่แนบมาในเมล์ได้ รวมไปถึงสามารถสรุปข้อมูลจากอีเมล์ที่ส่งเข้ามาใน Inbox ของเราได้

ตัวอย่าง การใช้ Gemini ช่วยสรุปอีเมล์ทั้งหมดให้ผู้ใช้งาน

Google แสดงตัวอย่างความสามารถนี้ด้วยสถานการณ์เช่น หลังจากหยุดยาวแล้วอีเมล์เข้ามาเป็นจำนวนมาก เพียงแค่แชทคุยกับ Gemini ให้สรุปเนื้อหาจากอีเมล์ใน Inbox ทั้งหมดของเราโดยไม่ต้องไปไล่อ่านก็สามารถทำได้ง่ายๆ นอกจากนี้ยังมีตัวอย่าง การเปรียบเทียบราคาซ่อมหลังคาจากผู้รับเหมาหลายๆเจ้าแบบรวดเร็ว เมื่อแต่ละเจ้าส่งอีเมล์ใบเสนอราคาเข้ามา เราก็แค่สั่งให้ Gemini สรุป ข้อเสนอและวันเริ่มงานของแต่ละเจ้าเปรียบเทียบกันกันได้เลยทันทีเป็นต้น

ให้ Gemini ค้นหารูปได้ตามเงื่อนไขที่ต้องการ

นอกจากนี้ Google ยังระบุด้วยว่าความสามารถของ Gemini ที่สามารถวิเคราะห์รูปภาพได้จะช่วยให้การค้นหารูปเก่าๆใน Google Photo ของเราง่ายยิ่งขึ้นเช่นสามารถ ค้นหารูปและคัดภาพที่เกี่ยวข้องกับพัฒนาการด้านการว่ายน้ำของลูกเราขึ้นมาให้ได้เลย และยังเปิดเผยด้วยว่า Gemini จะเข้ามาแทนที่ Google Assistant ในสมาร์ทโฟน Andriod พร้อมกับบอกด้วยว่าจะเป็นผู้ช่วยที่ทรงพลังมากกว่าคู่แข่งอย่าง Siri ใน iPhone

Google Veo, Imagen 3 และ Audio Overviews

ภายในงาน Google เปิดตัว “Veo” เอไอที่สามารถ generate วิดีโอความละเอียดสูง รวมไปถึงเปิดตัว “Imagen 3“ โมเดลสร้างภาพความละเอียดสูง Text-to-Image ที่พัฒนาขึ้นให้มีความผิดพลาดน้อยกว่าโมเดลก่อนหน้า

Veo ฟีเจอร์ Text-to-Video ที่พัฒนาให้เก่งขึ้น

ทั้ง Google Veo และ Imagen 3 จะเปิดให้ครีเอเตอร์ได้ใช้อย่างจำกัดในวันที่ 20 พฤษภาคมนี้และจะถูกนำเข้าไปรวมอยู่ในแพลทฟอร์ม Vertex AI แพลทฟอร์ม Machine Learning ของ Google ที่ให้นักพัฒนาใช้เทรนและสร้างแอป AI ต่อไป

นอกจาก 2 บริการสร้างภาพและวิดีโอนี้แล้ว Google ยังโชว์ตัวอย่างบริการเอไอใหม่ที่ชื่อว่า “Audio Overviews” ที่มีความสามารถในการสร้างบทสนทนาโต้ตอบตาม Text ที่ใส่เข้าไปเช่นหากผู้ใช้งาน upload แผนการสอน Chatbot ก็สามารถบรรยายสรุปเนื้อหาทั้งหมดออกมาได้เป็นต้น

เพิ่มพลัง AI ใน Google Search

Google จะเริ่มปล่อยบริการ AI Overviews ลงใน Google Search ให้ได้ใช้กันในสหรัฐอเมริกาก่อนเป็นที่แรกในวันที่ 20 พฤษภาคมนี้เช่นกัน โดยบริการ AI Overview จะตอบคำถามที่เราค้นหาด้วย AI แสดงผลเป็นสรุปอยู่ด้านบนสุดของผลการค้นหาเช่น หากเราใส่คำค้นว่าวิธีที่ดีที่สุดในการทำความสะอาดรองเท้าหนัง” AI Overview จะรวบรวมข้อมูลจากเว็บไซต์ต่างๆสรุปข้อมูลมาให้เป็นข้อๆ

AI Overviews ใน Google Search ที่จะเก่งขึ้นเรื่อยๆ

Google บอกด้วยว่าในอนาคตก็จะมีความสามารถเพิ่มเติมเหมือนเป็นผู้ช่วยคิดแพลนในรูปแบบต่างๆ เช่น “คิดเมนูอาหารสำหรับทานเป็นกลุ่มที่สามารถเตรียมวัตถุดิบได้ง่ายสำหรับ 3 วัน” ก็จะได้คำตอบที่พร้อมนำไปทำหรือปรับเปลี่ยนและนำไปใช้ต่อได้เลย

นอกจากนี้ Google ยังเปิดเผยด้วยว่ากำลังพัฒนา AI แบบ Multimodal ที่จะทำให้ Google Search สามารถใช้วิดีโอถ่ายภาพปัญหาที่เจอหรือสินค้าที่มีในมือ เพื่อให้ Google Search ช่วยแก้ปัญหาที่กำลังเจอได้ โดย Google โชว์ตัวอย่างวิธีใช้ โดยผู้ใช้งานถ่ายวิดีโอเครื่องเล่นแผ่นเสียงที่ทำงานผิดปกติ พร้อมกับถามคำถามไปพร้อมๆกัน Google Search ก็สามารถให้ AI หาคำตอบให้ได้ทันที

ค้นหาด้วยการถ่ายวิดีโอพร้อมถามคำถามแบบ real-time

 

อีกฟีเจอร์ที่อยู่ระหว่างการทดสอบก็คือ AI Teammate ที่จะติดตั้งเข้าไปใน Google Workspace โดยเอไอจะเข้าไปวิเคราะห์อีเมล์ ข้อความ รวมถึงไฟล์เอกสารและ PDF และเราก็สามารถถาม AI Teammate แบบง่ายๆเลยว่า เราพร้อมที่จะเปิดตัวสินค้าหรือบริการของเรา รึยัง โดย AI Teammate ก็จะเข้าไปวิเคราะห์ข้อมูลทุกอย่างใน Workspace และให้คำตอบเราได้เหมือนเพื่อร่วมงานหรือเลขาของเราคนหนึ่ง

Project Astra ผู้ช่วย AI อัจฉริยะ

โปรเจ็กต์ Astra เป็นโปรเจ็กต์สร้าง AI Assistant ดูแลโดย DeepMind AI หน่วยงานพัฒนาเอไอของ Google ซึ่งเวลานี้ Astra อยู่ในขึ้นของการพัฒนาตัวต้นแบบ โปรเจ็กต์นี้มีเป้าหมายที่จะสร้างผู้ช่วย AI แบบในภาพยนตร์ไซไฟก็ว่าได้

Gemini อธิบายโค้ดผ่านกล้องและสามารถช่วยหาแว่นตาที่วางลืมไว้ได้

 

จากวิดีโอตัวอย่างในงาน Google I/O แสดงให้เห็น ฟีเจอร์ผู้ช่วย AI ที่สามารถทำงานแบบเรียลไทม์ผ่านวิดีโอและการพูดคุยด้วยเสียง โดยผู้ช่วย AI สามารถอธิบายโค้ด หรือแม้แต่ช่วยหาแว่นตาที่วางลืมเอาไว้ได้ ฟีเจอร์นี้เป็นฟีเจอร์ที่ถูกนำไปเปรียบเทียบกับการเปิดตัว GPT-4o ของ OpenAI ที่สามารถโต้ตอบแบบ Realtime มีความสามารถทั้ง Text, Vision, และ Audio ได้อย่างรวดเร็ว

สำหรับ Astra นั้น Google ระบุว่าเตรียมนำไปเป็นฟีเจอร์เพิ่มเติมให้กับ Gemnini ภายในปีนี้

ทั้งหมดนี้คือไฮไลท์เด่นๆที่ Google นำมาประกาศในงาน Google I/O 2024 เมื่อวันที่ 14 พฤษภาคมที่ผ่านมาไม่นับการเปิดตัวฮาร์ดแวร์ประมวลผลที่สามารถนำไปรัน AI ที่ซับซ้อนมากๆได้ นับเป็นความคืบหน้าของการพัฒนา AI ที่ทำให้เราเห็นว่าตลาด AI ในเวลานี้กำลังแข่งขันกันอย่างดุเดือดอย่างยิ่ง และแน่นอนว่าการแข่งขันนี้ผู้บริโภคอย่างเราก็ได้ประโยชน์ไปด้วย

ที่มา CNBC, Google


  • 7
  •  
  •  
  •  
  •