Stability AI, popüler yapay zeka görüntü oluşturucusu alanında ses getiren bir gelişmeyi duyurdu Stable Diffusion’un yeni sürümü 3.5. Açık kaynaklı bir alternatif olarak Midjourney ve DALL E gibi platformlara rakip olmayı amaçlayan bu yeni model, daha önceki versiyonu olan Stable Diffusion 3 Medium’ın eleştirilerinden dersler çıkararak geliştirilmiştir. Stability AI yetkilileri, 3.5 modelinin, diğer görüntü oluşturuculara kıyasla promtlara daha iyi yanıt verdiğini ve çıktılarının kalitesinin daha büyük modellere bile rakip olacağını iddia ediyor.
Üç Farklı Model Seçeneği
Stable Diffusion 3.5, üç farklı versiyonla kullanıcıların beğenisine sunuluyor
- Stable Diffusion 3.5 Large Bu model, en yüksek kaliteye sahip olanıdır ve endüstride promt uyumu konusunda liderlik etmektedir. Profesyonel kullanımlar için 1 MP çözünürlük sunmaktadır.
- Stable Diffusion 3.5 Large Turbo Bu versiyon, daha büyük modelin “distile" edilmiş bir versiyonudur ve maksimum kalite yerine verimliliğe odaklanmaktadır. Stability AI, Turbo modelinin de yüksek kaliteli görüntüler ürettiğini ve dört adımda olağanüstü promt uyumu sağladığını belirtmektedir.
- Stable Diffusion 3.5 Medium 2.5 milyar parametreye sahip bu model, tüketici donanımlarında çalışacak şekilde tasarlanmıştır. Kalite ile basitlik arasında bir denge kurarak, 0.25 ile 2 megapiksel arasında görüntüler oluşturabilmektedir. Ancak, ilk iki modelin hemen kullanımda olduğu belirtilirken, 3.5 Medium’ın 29 Ekim’de piyasaya sürüleceği açıklanmıştır.
Önceki Versiyonun Eleştirileri ve Yeni Filtreler
Yeni modelin açıklanması, daha önceki sürümde yaşanan sıkıntıların gölgesinde kalmamaktadır. Stability AI, geçtiğimiz Haziran ayında çıkan Stable Diffusion 3 Medium’ın beklentileri karşılayamadığını kabul ederek, standartlarını karşılamadığını ve bazı yanıtların “gülünç" bir şekilde grotesk vücut korkusunu içerdiğini belirtmişti. Şirketin, 3.5 serisinde vurguladığı olağanüstü promt uyumu, bu eleştirilerin ışığında önem kazanıyor.
Dahası, yeni model serisi, insan çeşitliliğini daha iyi yansıtmak amacıyla yeni filtreler içermektedir. Stability AI, bu modellerin insan çıktılarını dünyanın çeşitliliğini temsil edecek şekilde, farklı cilt tonları ve özellikleriyle sunduğunu bunun için kapsamlı bir promt gereksinimi olmadığını ifade etmektedir.
Tarihi Duyarlılık ve Farklılıklar
Yeni modelin bu temel özellikleri, teknolojinin tarihsel ve kültürel duyarlılıkları dikkate alıp almayacağı konusunda tartışmalara neden olabilir. Örnek olarak, Google’ın yaşadığı sorunları hatırlatmakta fayda var bu yılın başlarında Gemini, tarihi fotoğraflarda etnik açıdan yanlı ve yanlış temsil edilen figürler oluşturmuştu. Bu durumun yankıları o kadar büyük oldu ki Google, insan nesillerini altı ay boyunca yeniden entegre edemedi.
Stable Diffusion 3.5 ile Stability AI, kullanıcıların beklentilerini karşılayacak ve yapay zeka destekli görüntü oluşturma deneyimini geliştirecek bir adım atmış durumda. Yeni modelin, yapay zeka alanında sağladığı yenilikçi çözümler ve çeşitli filtreler ile, geçmişteki hatalardan ders alarak daha doğru ve kapsayıcı sonuçlar sunması umuluyor.