ไม่ต้องพึ่งกราฟฟิค! วิธีใช้ AI ตัดต่อภาพ ง่ายๆด้วย Gemini 2.0 Flash ผ่าน Google AI Studio

หลังจากทดสอบกับคนกลุ่มเล็กๆมาระยะหนึ่ง ล่าสุด Google เพิ่งเปิดให้นักพัฒนาได้เข้าไปทดลองใช้ Gemini 2.0 Flash ที่มีความสามารถใหม่อย่าง Image Generation กันแล้ว โมเดลนี้หลายคนรอคอยเพราะเป็นโมเดลสร้างภาพที่ Gen ภาพได้รวดเร็วกว่าทุกโมเดลที่เคยมีมาแถมยังสั่ง Edit ภาพตามสั่งได้ด้วย

สำหรับโมเดล Gemini 2.0 Flash (Image Generation) นี้เป็นเวอร์ชั่นทดลองที่เปิดให้ใช้งานใน Google AI Studio แพลทฟอร์มสำหรับนักพัฒนาที่เข้ามาทดสอบโมเดล Google Gemini รูปแบบต่างๆ ก่อนนำไปเชื่อมเข้ากับแอปพลิเคชั่นของตัวเอง ทั้งนี้ก็เชื่อว่าในอนาคตโมเดลนี้จะไปอยู่ในแอปพลิเคชั่น Gemini ที่เราใช้กันปกติด้วยเช่นกัน

อย่างไรก็ตามคนทั่วไปอย่างเราก็เข้าใช้งาน Gemini 2.0 Flash (Image Generation) ได้ผ่าน Google AI Studio ได้เหมือนกันที่สำคัญใช้งานได้ “ฟรี” ด้วย

วิธีเข้าใช้ก็ทำได้ดังนี้

เข้าเว็บ aistudio.google.com ผ่านเว็บเบราเซอร์
กด sign in to Google AI Studio
ใช้บัญชี Google ล็อกอินเข้าไป
เมื่อเข้าหน้าจอหลักให้กด Try Gemini

เลือกโมเดลที่ด้านบนสุดเปลี่ยนจาก Gemini 2.0 Flash เป็น Gemini 2.0 Flash (Image Generation)
จากนั้นก็ Prompt คำสั่งได้เลย

ทำอะไรได้บ้าง?

Gemini 2.0 Flash เป็น Gemini 2.0 Flash (Image Generation) เป็น AI แบบ Multimodal หรือมีความสามารถทั้งแบบ Text2Text และ Text2 Image อยู่ในตัวเดียว

ที่พิเศษก็คือความเร็วที่ว่ากันว่าสร้างภาพได้รวดเร็วกว่าโมเดลสร้างภาพที่เรารู้จักกันดีอย่าง Dall-E หรือ Midjourney ด้วย นอกจากนี้ยังสร้างภาพได้ครั้งละหลายๆภาพ และมีความสามารถในการ Edit แก้ไขภาพที่เราส่งเข้าไปได้ด้วย

ซึ่งโมเดลนี้ก็มีคนใช้งานเป็นตัวอย่างแล้วมากมายเช่น

สร้างภาพหลายๆภาพพร้อมเนื้อเรื่อง (Visual Story)

Edit เพิ่มลดสิ่งต่างๆในภาพ
การเปลี่ยนฉลากหลังของภาพ
เปลี่ยนท่าทางของนายแบบนางแบบ

เปลี่ยนสินค้าในมือนายแบบนางแบบ
สั่งเพิ่มวัตถุหรือตัวอักษรในภาพ
ลบลายน้ำ
เปลี่ยนภาพร่างเป็นภาพ

แน่นอนว่าจากการทดใช้งาน Gemini 2.0 Flash (Image Generation) ยังคงมีความผิดเพี้ยนอยู่บ้างเช่นใบหน้า ตัวหนังสือหรือรายละเอียดสิ่งของยังคงผิดเพี้ยนอยู่

เทคนิคที่จะลดความผิดเพี้ยนเหล่านี้ก็คือ

👉 ต้องใช้คำสั่งที่เฉพาะเจาะจงมากๆ เช่นเมื่อเราส่งรูปของเราเข้าไป อย่าสั่งแค่ “เปลี่ยนภาพพื้นหลังเป็นสนามกีฬา”

แต่ให้สั่งว่า “เปลี่ยนภาพพื้นหลังเป็นบรรยากาศรับถ้วยแชมป์พรีเมียร์ลีกในสนามโอลแทรฟฟอร์ดที่มีแฟนบอลเต็มสนาม มีเพื่อนร่วมทีมร่วมดีใจแบบสุดเหวี่ยง โฟกัสที่ตัวแบบหลักใส่ดสื้อแมนเชสเตอร์ ยูไนเต็ด สองมือชูถ้วยแชมป์พรีเมียร์ลีก มีเพื่อนร่วมทีมที่กำลังฉลองเป็น background สไตล์ภาพภาพสไตล์ภาพถ่ายจริงๆจากช่างภาพข่าวกีฬา เป็นภาพถ่ายบุคคลครึ่งตัวใช้เลนส์ 100mm รูรับแสง F 4.0”

จะเห็นว่าต้องบรรยายอย่างละเอียดตั้งแต่สนามกีฬาอะไร บรรยากาศ จำนวนคนทั้งระยะใกล้และไกล เสื้อผ้าที่ใส่ ท่าทางที่ใช้ สิ่งของที่ถือ สไตล์ภาพ ถ้าละเอียดได้ไปถึงระยะเลนส์ที่ใช้ ค่ารูรับแสงที่สร้างความเบลอหลัง รวมไปถึง สปีดชัตเตอร์ได้ก็ยิ่งดี

ข้อควรระวัง

อย่างไรก็ตามสิ่งหนึ่งที่ต้องระวังก็คือการทดลองใช้ใน Google AI Studio นั้นไม่ควรนำรูปหรือข้อมูลที่มีความเป็นส่วนตัวส่งเข้าไปเนื่องจาก Google จะนำข้อมูลเหล่านั้นไปพัฒนาโมเดลต่อไปในอนาคต ดังนั้น ก็ต้องระวังกันนิดนึง

ใครอยากทดลองใช้ก็ให้ลองเข้าไปใช้กันดูที่ aistudio.google.com

Marketing Oops!

ไม่ต้องพึ่งกราฟฟิค! วิธีใช้ AI ตัดต่อภาพ ง่ายๆด้วย Gemini 2.0 Flash ผ่าน Google AI Studio

วิธีเข้าใช้ก็ทำได้ดังนี้

ทำอะไรได้บ้าง?

เทคนิคที่จะลดความผิดเพี้ยนเหล่านี้ก็คือ

ข้อควรระวัง