Pada 20 Mei 2025, Google secara resmi meluncurkan model AI terbaru yaitu Veo 3. Model ini mampu menghasilkan video berkualitas 4K berdurasi 8 detik. Video dapat diunduh dengan format GIF atau rasio 16:9 dan 9:16.
Video yang dihasilkan berasal dari prompt atau teks yang kita input seperti pada Chat GPT. Uniknya, kita dapat mengatur berbagai hal seperti gerakan kamera, sudut pandang, lensa yang digunakan, hingga bagaimana objek bergerak hanya menggunakan prompt.
Selain itu, kita dapat meminta model ini menghasilkan audio yang berkesan nyata. Mulai dari backsound video, efek audio, bahkan menirukan suara manusia secara ekspresif.
Ketika model ini menirukan manusia berbicara, sinkronisasi antara gerakan bibir dan teks cukup akurat. Dilansir dari FT news, Veo 3 mengintegrasikan audio dan teks menggunakan beberapa variabel, seperti waktu, durasi pembacaan teks, dan kecepatan gerakan bibir.
Selain itu, dikutip dari CNN Indonesia, model Veo 3 juga mampu mengkalkulasikan material, jarak, dan kecepatan untuk menciptakan sinkronisasi audio yang baik.
Contohnya, suara mobil yang melaju 100 km/h akan berbeda dengan mobil yang hanya melaju 20 km/h. Begitupun dengan suara orang berteriak di dalam ruang kosong akan berbeda dengan yang berteriak di alam bebas.
Model Veo 3 yang diluncurkan Google dapat dikatakan sangat pintar dan canggih. Veo 3 mampu memahami teks secara komprehensif, kemudian menerjemahkannya hingga menjadi video yang berkesan nyata.
Baca Juga: Sentimen Publik terhadap AI: Optimis, Khawatir, atau Masih Ragu?