Geçenlerde bir sunum hazırlıyordum ve çok özel bir görsele ihtiyacım oldu. Bir yunus görseline. Ama okyanusta değil uzayda, Satürn gezegeni yakınlarında. Dolayısıyla astronot giysili bir yunus olması gerekiyor. Tabi arama motoruna “Satürn’de astronot giysili bir yunus” yazıp aradığınızda hiçbir şey bulamıyorsunuz. İngilizce arama yapsanız bile pek bir şey çıkmıyor. O zaman ne yapabiliriz? Bilgisayardan bizim için böyle bir resim yapmasını rica edebiliriz.
Geçen yıl sizlere anlattığım bir yapay zeka vardı hatırlıyor musunuz? “Ne dersen çizen bir yapay zeka çıktı!” demiştim. “Salyangoz burger” gibi en absürt istekleri bile yerine getirebiliyordu. İşte geçen hafta onun yeni versiyonu duyuruldu: DALL-E 2. Bu kez çok daha yüksek çözünürlüklü ve kaliteli sonuçları çok daha kısa sürede çizebiliyor. “Satürn’de astronot giysili bir yunus” dediğinizde tam olarak böyle bir görsel hazırlıyor. Yapay zekanın adı sürrealist ressam Dali ve bir animasyon kahramanı olan Wall-e’den türetilmiş. Dolayısıyla bundan ilham alarak bana “yüzünün yarısı robot, diğer yarısı da Salvador Dalí olan bir portre çizebilir misin?” diye sorarsanız hiç itiraz etmiyor. Bir değil, onlarca farklı versiyonunu çok kısa bir sürede hazırlıyor. Yapabildikleri sadece resim benzeri illüstrasyonlar değil; son derece gerçekçi fotoğraflar da üretebiliyor. “Times meydanında kaykaya binen oyuncak ayı” görsellerine bir bakın. Bunların fotoğraf gibi gözükmesi sizi aldatmasın. Hiçbiri bir fotoğrafçı tarafından çekilmedi, bir bilgisayar algoritması tarafından hayal edildi.
DALL·E 2, sizin söylediğiniz bir şeyden orijinal, gerçekçi görüntüler ve hatta sanat eserleri oluşturabiliyor. Kavramları, nitelikleri ve stilleri birleştirebiliyor.
Oyuncak ayı örneğimizden devam edelim. Çok çılgın bir şey çizmesini isteyelim: Oyuncak ayıları bize “çılgın bilim insanları gibi köpüklü kimyasalları karıştırırken” göstersin ama “1990’ların Cumartesi sabahı çizgi filmleri”ndekine benzer bir stille yapsın bu çizimi. Dediğim gibi bir değil, onlarca alternatif sonuç üretiyor. Peki aynı spesifik konuyu “dijital sanat” stiliyle hazırlasın. Stili bir kez daha değiştirelim: “buharlı makinelerin hâlâ yaygın olarak kullanıldığı, 19. yüzyılda veya sıklıkla Viktorya Dönemi İngiltere’sinde geçen H. G. Wells ve Jules Verne’in çalışmalarında da olduğu gibi kurgusal teknolojiler ya da bilgisayarın erken dönemde icadı gibi gerçek teknolojik yenilikler de içeren bir retrofütüristik bilimkurgu alt-türü”nde çizebilir misin acaba bu “çılgın bilim insanları gibi köpüklü kimyasalları karıştıran” oyuncak ayıları? Yani şu görselleri tarif ederken ne demek istediğimi ben bile tam olarak anlayamamış olabilirim ama DALL-E 2 leb derken leblebi başta olmak üzere ortaya karışık bir kuruyemiş seçkisi hazırlayıveriyor.
Bu yeni sürümde beni en çok heyecanlandıran kısım resimlere düzenleme yapmaya başlaması oldu. Herhangi bir görsele istediğiniz bir şeyi ekleyebiliyor ve bunu yaparken gölgeleri, yansımaları ve dokuları da hesaba katıyor. Diyelim ki bir iç mimarsınız ve hazırladığınız bir görsele yeni bir nesne eklemek istiyorsunuz. Mesela bu tasarıma bir flamingo ekleyelim. Normalde böyle bir şey yapmak için stok fotoğraf kütüphanelerinden birine gidip arama yaparız. Flamingo kelimesini arayınca 1521 farklı sonuç çıkardı. Belli kriterlere göre arama sonuçlarımı daraltabilirim. Mesela renklerden pembeyi seçince sonuçlar 523’e indi. Oryantasyonu dikey ve izole olsun deyince de bu kriterlere uygun 47 tane flamingo görseli bulmuş oldum. İç tasarımımda bir havuz olduğu için şu şişme flamingo aksesuarı oraya yakışır. Bunu alıp o görsele Photoshop’ta yerleştiriyorum. Klasik bir tasarım iş akışındaki adımlar genel olarak böyledir.
Aynı şeyi yapay zekaya tarif ederek yapabiliyoruz. Resmin şurasına flamingo yerleştir demem yeterli. Farklı yönlerde ve açılarda alternatifleri oluşturmasının yanı sıra sudaki yansıma detayını da oraya yerleştiriyor. Resimdeki ışık kaynağının nerede olduğunu tespit ediyor ve ona göre gölgelendiriyor. Herşeyden önemlisi resmin şurasına demek dışında hiçbir şeyi söylemedim. Orada bir havuz olduğunu fark ettiği için böyle bir seçim yaptı. Eğer resmin şurasına deseydim, bakın o kısımdaki malzemede oluşacak ışık gölge oyunları ve yansıma daha farklı olacağı için ona göre değiştiriyor. Eğer içeride değil de dışarıda bir yerlere flamingo koy deseydim bu kez aksesuar yerine gerçek flamingo koymayı tercih ediyor. Yani mekan ve nesneler arasındaki ilişkiyi anlayıp bağlama göre farklı tercihlerde bulunuyor.
Bir müzenin içindeki şu görselde bağlama göre değişikliği nasıl yaptığını daha iyi anlayabiliriz. Buraya bir köpek ekleyeceğiz. Tabureyi seçtiğimde oraya gerçek bir köpek fotoğrafı koyuyor. Ama duvardaki tabloyu seçersem onun içine çizim olarak bir köpek yerleştiriyor. Diğer tabloyu seçersem bu kez onun stiline uygun bir köpek boyayıp yerleştiriyor. Çünkü soldaki bu görsel yağlıboya bir portre. Sağdaki ise daha soyut bir çalışma. Ürettiği varyasyonlarda köpeğin tablonun içindeki diğer nesneleri de analiz ederek ona göre açı ve şekil değiştirdiğini görebiliyoruz.
Üçüncü örneğimizde yapay zeka yine bir iç mimar gibi davranıyor ve istediğimiz yere koltuk yerleştirmeye başlıyor. Bu kez onun sadece ışık-gölge ve yansıma değil içinde bulunduğu mekanın perspektif özelliklerini de yakaladığını fark ediyoruz. Diyelim ki dekore etmek istediğiniz bir banyonuz var. Onun fotoğrafını çektikten sonra bu görselden ilham alarak size farklı varyasyonlarını üretmeye başlıyor.
Onun bu ilham alma özelliğini sanat eserlerine de uyarlayabiliyorsunuz. Mesela yeniden dekore etmek istediğiniz banyonun duvarına meşhur “inci küpeli kız” tablosunu asmak istiyorsunuz. 1665’de yapılan bu tabloyu o yıllarda ve hatta sonraki 200 yıllık dönemde rahatlıkla satın alabilirdiniz. Çünkü 1881’deki bir açık arttırmada yaklaşık 1$’a alıcı bulduğunu biliyoruz. Fakat şu anda ressamın bu kadar meşhur olmayan diğer eserleri bile ortalama 30 milyon dolara satıldığı için muhtemelen yapay zekaya benzeri bir çalışmayı yaptırmak daha pratik olacaktır. Tıpkı yalnızca olağanüstü güzellikte değil aynı zamanda olağanüstü tuhaflıkta da resimler çizen Hollandalı ressamın Türk modasından ilham alarak yaptığını bildiğimiz bu tablosundan bu kez bilgisayar ilham alarak neredeyse sonsuz diyebileceğimiz bir çeşitlilikte varyasyonlarını üretmeye başlıyor.
Bu kadar çok varyasyonu üretilince ne oluyor? Üretilenlerin değeri düşerken ilham alınan, kopyalanmaya çalışılan orijinalinin değeri artıyor. Çünkü tek olan, özgün olan, biricik olan her zaman daha değerlidir.
DALL·E 2, görüntüler ile onları tanımlamak için kullanılan metin arasındaki ilişkileri öğrenebiliyor. Rastgele noktalardan oluşan bir desenle başlayan ve o resmin belirli yönlerini tanıdığında bu deseni kademeli olarak bir resme doğru değiştiren “difüzyon” adında bir süreç kullanıyor.
Geçen yılki ilk versiyonuna göre 4 kat yüksek çözünürlükte görselleri tarifinize çok daha uygun ve net olarak yapıyor. “gün doğumunda bir tarlada oturan bir tilki resmini Claude Monet’in tarzında çiz” dediğimizde iki versiyon arasındaki sonuç farkından bunu çok rahat anlayabiliyoruz.
Tüm bu şaşırtıcı özelliklerini görünce insan hemen bu teknolojiyi nasıl kullanmaya başlayabilirim diye düşünüyor. Ama tıpkı bir önceki sürümde olduğu gibi bu sürümde de API’nı yayınlamamışlar. Yani ticari olarak henüz kullanılamıyor.
Gerekçesini anlayabilmek çok zor değil. Kötü niyetli kişilerin elinde böylesine güçlü bir teknolojinin sonuçlarını henüz öngöremiyoruz. O yüzden geliştiricileri DALL·E 2’nin şiddet içeren, nefret dolu veya yetişkinlere yönelik görüntüler oluşturma yeteneğini sınırlamış. Ayrıca, ünlü kişilerin yüzleri de dahil olmak üzere gerçek kişilerin yüzlerinin fotogerçekçi versiyonlarını üretebilmesini önlemek için gelişmiş teknikler kullanmaya çalıştıklarını söylüyorlar. Yani frene basmaya çalışıyorlar. Çünkü şu haliyle bile şiddet ya da cinsellik içeren, siyasi propaganda amaçlı görselleri rahatlıkla oluşturabilecek güçte.
Her geçen gün bilgisayar teknolojilerinde, yapay zeka alanında yeni gelişmeleri görüyoruz. Şaşırıyoruz. Ürküyoruz. Korkuyoruz. Umudumuz DALL·E 2 ve benzeri teknolojilerin insanlara köstek değil destek olması. Kendimizi yaratıcı bir şekilde ifade etmek için bizi güçlendirmesi…
“Ne dersen çizebilen DALL-E’nin yenisi çok daha şaşırtıcı” için 3 yanıt
Dall-e’i kullanıma açık mı acaba, değilse kimler kullanabilecek ve ne zaman kullanılabilecek?
İyi günler Barış bey. Videonuzda bahsettiğiniz yapay zeka gelişmelerinin yanında başka bir şey daha dikkatimi çekti. Tişörtünüz. Evet, tişörtünüz. Tişörtünüz gerçekten çok hoş bir tasarıma sahip, tişörtünüzü temin edebileceğim bir yer var mı? Ya da belki markasını öğrenirsem onu daha kolay bulabilirim. Şimdiden teşekkür ederim.
Bu bilgileri nereden nasıl buluyorsun. Öyle araştırdım buldum denecek cinsten değiller. İlk kez burada duydum. (DALL-E)
İyi çalışmalar.