OpenAI เคยให้ข่าวตั้งแต่ต้นปี 2023 ว่ากำลังพัฒนา Generative AI ที่เป็น text-to-video ซึ่งหมายถึงการใช้คำสั่งข้อความสร้างวิดีโอตาม Prompt หรือตามการบรรยายของผู้ใช้งานได้
วันที่ 15-02-2024 OpenAI เปิดตัว Sora ซึ่งเป็น AI ที่สามารถสร้างวิดีโอตามคำสั่งข้อความได้ และมีความยาวสูงสุดถึง 1 นาที
เริ่มมีการให้ทดลองใช้เฉพาะกลุ่ม เช่น Visual Artist, Designer, Filmmaker เพื่อประเมินความเสี่ยง และรับคำติชมเอาไปพัฒนาโมเดลให้ดีขึ้น
มีวิดีโอสาธิตให้ชม (สามารถดูตัวอย่างวิดีโอที่ AI สร้างจาก Comment ในโพสต์นี้)
ถ้าเทียบกับโมเดลอื่น Sora เป็น AI สร้างวิดีโอที่ดูสมจริงมากที่สุด และยังสามารถพัฒนาให้ดีขึ้นไปอีก
ตัวอย่างหนึ่งของคลิปวิดีโอยาว 1 นาที จาก Sora มี Prompt สั่ง AI สร้างวิดีโอว่า:
สไตล์ลิสต์ผู้หญิงเดินไปตามถนนในโตเกียวที่เต็มไปด้วยแสงนีออนที่ดูอบอุ่นที่มีป้ายเคลื่อนไหวในเมือง เธอสวมแจ็กเก็ตหนังสีดำ ใส่ชุดเดรสยาวสีแดงและรองเท้าบูทสีดำ สวมแว่นกันแดด ทาลิปสติกสีแดง เธอเดินอย่างมั่นใจแบบสบายๆบนถนนที่มีสภาพชื้นและสะท้อนแสง ทำให้เกิดเอฟเฟ็กต์กระจกจากแสงไฟหลากสี มีคนเดินถนนจำนวนมากกำลังเดินพลุกพล่าน
ถ้าไม่บอกว่า AI สร้างคลิปวิดีโอนี้ขึ้นมา คงยากที่จะเชื่อว่ามันทำได้จริง
OpenAI ไม่ใช่บริษัทเดียวที่กำลังสร้าง Generative AI ประเภท text-to-video บริษัทอื่นที่กำลังทำอยู่ เช่น Phenaki, Make-A-Video (Meta), Imagen Video (Google), NUWA and NUWA-Infinity, VideoGPT, CogVideo (Chinese), Video Diffusion Models, MagicVideo, Tune-a-Video
ใครที่ยังคิดว่า AI ไม่มีความคิดสร้างสรรค์ หากได้ดูวิดีโอที่ AI สร้างขึ้น คงต้องเปลี่ยนความคิด!!
โมเดล text-to-video อย่าง Sora มีส่วนช่วยในการพัฒนาปัญญาประดิษฐ์ที่กำลังก้าวไปสู่ AGI หรือ Artificial General Intelligence ซึ่งเป็น AI ที่มีความสามารถทั่วไปเหมือนมนุษย์หรือเหนือกว่ามนุษย์
AI สามารถจินตนาการจากคำพูดหรือคำสั่งข้อความได้จริง หากมันไม่มีสมอง คิดไม่เป็น ไม่มีความคิดสร้างสรรค์ มันไม่มีทางสร้างวิดีโอแบบนี้ได้แน่!!!
แหล่งข้อมูล
https://www.facebook.com/photo/?fbid=848724447266233&set=a.687193000086046