Son yıllarda yapay zeka (YZ) teknolojilerinin gelişimi, video üretiminde devrim niteliğinde yenilikler getirmeye başladı. Meta, bu alandaki son ürünü olan Movie Gen ile dikkatleri üzerine çekiyor. Movie Gen, hem müzik hem de ses efektleri ile birlikte gerçeğe oldukça yakın videolar üretebiliyor. Ancak bu teknoloji, bazı tartışmalara da yol açmakta.
Movie Gen, 16 fps ya da 24 fps hızlarında, 768x768 piksel çözünürlükten 1080p'ye kadar video üretebiliyor. Özellikle kullanıcıların kendi fotoğraflarını yükleyerek kişiselleştirilmiş videolar oluşturması mümkün. Bunun yanı sıra, metin komutları kullanarak mevcut videolar üzerinde de düzenleme yapmak oldukça basit hale geliyor. Instagram için cep telefonunda çektiğiniz videoları düzenlemenin ne kadar kolay olacağını hayal etmek zor değil. Ancak şu an için Movie Gen yalnızca bir araştırma projesi Meta bu teknolojiyi kamuya açmayacağını belirtti, bu nedenle yapay zeka tabanlı video üretiminin ne anlama geleceğini düşünmek için daha fazla zamanımız var.
Meta, Movie Gen'i YZ araştırmalarının "üçüncü dalgası" olarak tanımlıyor ve bu yaklaşım, daha önceki medya yaratım araçları olan Make A Scene ve Llama modelinin sonrasında gelmektedir. Movie Gen, 30 milyar parametreli bir transformer modeli kullanarak 16 saniye uzunluğunda 16 fps videolar ve 10 saniye uzunluğunda 24 fps görüntüler oluşturabiliyor. Ayrıca, 13 milyar parametreli bir ses modeline sahip olan Movie Gen, 48kHz kalitesindeki içeriklerle 45 saniyelik ses efektleri ve müzikler üretebiliyor. Ancak şimdilik senkronize ses desteği mevcut değil.
Meta, Movie Gen'i "lisanslı ve kamuya açık veri setlerinin kombinasyonu" ile eğittiğini belirtiyor. Bu, yaklaşık olarak 100 milyon video, bir milyar resim ve bir milyon saatlik ses içerdiği anlamına geliyor. Ancak bu veri kaynakları hakkında daha fazla detay verilmediği için, bu durum bazı endişeleri de beraberinde getiriyor. Meta'nın, Avustralya kullanıcılarına ait verileri YZ modellerinde kullandığına ilişkin kabulü, şeffaflık konusunda soru işareti yaratıyor.
Movie Gen'in performansına gelince, ilk bakışta oldukça etkileyici görünüyor. Meta, kendi A/B testlerinde, kullanıcıların genel olarak Movie Gen sonuçlarını OpenAI'nin Sora ve Runway'nin Gen3 modeline kıyasla daha fazla tercih ettiğini rapor etti. Movie Gen'in ürettiği AI insan figürleri, yapay zeka videolarında sıkça rastlanan rahatsız edici gözler ve parmaklar gibi belirtilerden uzak, oldukça gerçekçi görünüyor.
Movie Gen ekibi, bir blog yazısında şu açıklamayı yaptı "Bu temel modeller için birçok heyecan verici kullanım durumu olsa da, üretken yapay zekanın sanatçıların ve animatörlerin işlerinin yerini almaması gerektiğini belirtmek önemlidir." Bu teknoloji, insanların kendilerini ifade etmeleri için yeni yollar sunma potansiyeline sahip olduğunu vurguluyor.
Ancak, genel kullanıcılar yapay zeka video teknolojilerini nasıl kullanacak? Yapay zeka ile üretilmiş videolar, kişisel fotoğraflarımızın ve videolarımızın yerini alacak mı? Yoksa Movie Gen, bireysel içeriklerimizi daha keskin hale getirecek araçlar olarak mı ayrıştırılacak? Bugün, akıllı telefonlar ve bilgisayarlarda arka plandan nesne kaldırmak oldukça kolay ve daha sofistike YZ video düzenleme çözümleri, bu mantığın bir sonraki mantıklı adımı gibi görünüyor.
Movie Gen gibi teknolojilerle birlikte video üretiminin geleceği, hem yaratıcı hem de endüstriyel anlamda önemli bir değişim yaşama potansiyeline sahip. Ancak bu değişimin beraberinde getireceği etik tartışmalar ve toplumsal etkileri üzerinde düşünmek, hepimizin önündeki en önemli görevlerden biri olmalı.