Kategoriler
Tasarım Teknoloji

Yapay zeka GauGAN, çizimleri tabloya dönüştürmeyi öğrendi

Yapay zeka dünyasından çok ilgimi çeken yeni bir gelişmeyi sizlerle paylaşmak istiyorum. Bu gördüğünüz basit çizimi, şöyle bir tabloya dönüştürebilir misiniz? Ne kadar sürede? Bob Ross olsa yarım saatte yapardı herhalde. Artık bilgisayar yardımıyla böyle bir tabloyu hazırlamak yarım dakika bile sürmüyor.

Hazır mısınız?

Bu yazılımda NVIDIA tarafından geliştirilen bir “derin öğrenme modeli” kullanılmış. Karalamaları fotorealistik tablolara dönüştürüyor. Bunu yaparken “Üretken Ters Ağ – Generative Adversarial Network (GAN)” yöntemini kullandığı için geliştirilen yazılıma “GauGAN” demişler. Sonunu anladık da ismin baş tarafı nereden geliyor diyenler şu tablodaki imzaya bakabilir. Evet post-empresyonist ressam Gauguin’den esinlenmişler.

Programın arayüzünde iki ana panel var. Sol taraftaki panelde kabaca yaptığınız bir çizim sağ taraftaki panelde gerçek zamanlı olarak bir tabloya dönüşüyor. Peki yapay zeka bu kadar kabaca yapılan çizimin parçalarının ne olduğunu nasıl anlıyor? Çizim yaparken kullandığınız renklerin bir anlamı var. Açık mavinin gökyüzü, yeşilin ağaç, koyu yeşilin dağ olduğunu kabul ediyor. Daha önce çizdiğiniz dağları beğenmediniz mi? Basıyorsunuz kahverengiye, bir anda yeşil dağlar taşlı dağlara dönüşüyor.

Burada önemli bir karar verme aşamasındayız. Çağlayanın nerede olmasını istediğimize karar veriyoruz. Belki işte burada. Dokunuyoruz ve çiuvvv… Gördünüz mü hepsi bu.”

“Gördünüz mü hepsi bu” derdi ya Bob Ross. Bir fırça darbesiyle çağlayanlar çizerdi gözümüzün önünde. İşte yeni geliştirilen yazılım GauGAN sayesinde Bob Ross olmaya bir adım daha yaklaşıyoruz. Duygular şelale.

Aklınızdaki bir fikri görselleştirmenin en hızlı yollarından biri bu olsa gerek. Şimdi iki renkle denizi ve gökyüzünü halledip, manzaranın soluna bir kaya parçası yerleştirelim. Kabaca aklınızdaki şeklin hatlarını çizip içini doldurmak istediğiniz renkle boyayınca tablonuz hazır. Dikkat ederseniz sadece şeklin kendisini değil, içinde bulunduğu ortamla ilişkisini de çizdi. Denizin üstünde taşın yansımalarını oluşturdu. Yazılım bu işlemi onu kodlayanlar önceden bu yansıma özelliğini eklediği için değil, kendisi makine öğrenmesi yöntemiyle öğrendiği için yaptı. Milyonlarca çizimi, resmi, tabloyu inceleyen “derin öğrenme modeli” sayesinde resme eklediğiniz yeni nesneler diğerleriyle olan ilişkisine göre bu tür yansımalar oluşturabiliyor.

Mesela bu görselde çim zemin yerine kar yerleştirirseniz sadece sol panelde değiştirdiğiniz alt bölüm değil, üst bölümler de yeni duruma göre renk değiştiriyor. Bu bölümlere segmentasyon haritası adını vermişler. Çocukların boyama kitapları kadar basit bir yöntemle oluşturduğunuz kompozisyon yapay zeka tarafından onun daha önce gördüğü ve öğrendiği resimlere göre otomatik olarak oluşturuluyor. Dokuların yanı sıra ışık, gölge, yansıma gibi diğer özellikler de ekleniyor.

Demo aşamasındaki bu yazılımı biz henüz deneyemiyoruz. Ancak benzer bir mantıkla hazırlanmış bir yapay zekayı hemen şu anda siz de test edebilirsiniz. Google Quickdraw uygulaması dünyanın en büyük karalama veritabanına sahip. Bu veritabanında bugüne kadar 15 milyon kişinin çizdiği 50 milyon karalama var. Kullanmaya başlayınca sizden 20 saniye içinde bir çizim yapmanızı istiyor. Mesela benden bir burun çizmemi istedi. Daha ilk çizgiden itibaren tahminlerde bulunmaya başlıyor. Bu tahminleri sadece yaptığınız şekle göre değil onu yapış biçiminize göre de belirliyor. Bir yandan da sizin yaptığınız çizimden bir şeyler öğreniyor. Bizler ya da yazılımcılar, araştırmacılar, tasarımcılar, sanatçılar da dünyanın ortak düşünme biçimini keşfediyor. Şuraya bir bakın. Modern bir hiyeroglif gibi. 345 kategorideki 50 milyon çizime ait bu dataseti açık kaynak kodlu olarak GitHub’dan ücretsiz olarak indirip kendi çalışmalarınızda kullanabilirsiniz.

GitHub’da bulabileceğiniz bir başka açık kaynak kod da “Neural Doodle.” 3 yıldır geliştirilen bu kodla videonun başında gösterdiğim yazılıma çok benzer sonuçlar elde edebiliyorsunuz. Bu yazılım da “nöral yama” algoritmasından yararlanarak geliştirilmiş. Gerçek sanatçılardan semantik stil transferi yaparak çizimleri tabloya dönüştürüyor.

Özellikle manga sanatçılarının çok kullandığı bir yazılım var: Clip Studio Paint. Geçtiğimiz aylarda bu tasarım yazılımına ilginç bir özellik eklendi. Siyah beyaz bir çizimi otomatik olarak renklendiriyor. Eğer segmentasyon yapıp belli başlı bölgelerinin hangi renk olacağını çok kabaca belirtirseniz o bölgeleri sizin tercihinize göre renklendiriyor.

Elbette GauGAN bundan çok daha gelişmiş bir yazılım. Şimdilik sadece doğa manzaralarını oluşturabiliyor. Geliştiricileri yakında binalar, yollar ve insanlar gibi görselleri de oluşturabileceğini söylüyor.

Peki böyle bir araç nerede işimize yarar? Başta şehir bölge planlamacıları, mimarlar, peyzaj tasarımcıları olmak üzere tasarımla ilgili pek çok alanda uzmanların işini kolaylaştırıp hızlandıracak. Oyun geliştiricileri için de üretkenliği arttıran bir araç.

Peki bu tür araçlar resim çizme becerisini ortadan kaldıracak mı? Herkes ressam mı olacak? Benim düşüncem nasıl cep telefonu ve instagram herkesi fotoğrafçı yapamadıysa bu da ressam yapmayacak. Sizin düşünceniz ne? Bu tür teknolojik gelişmeleri gördükçe kendinizi nasıl hissediyorsunuz?

Geçenlerde yaptığım ayna dünyalar videosunu izleyenler hatırlayacaktır. Videonun sonunda “Şu anda gerçek dünyanın bir yerlerinde bu ayna dünyayı yapmaya başladılar.” demiştim. İşte bugün gösterdiğim tasarım aracı başka nerede işimize yarar? O ayna dünyaların yapımında.

“Yapay zeka GauGAN, çizimleri tabloya dönüştürmeyi öğrendi” için 19 yanıt

barış abi birşey sorucam video’nun sonundaki müzik çok ilgimi çekti youtube a yazsam cevap vermezdin diye buraya bırakıyorum umarım cevap verirsin iyi günler. :]

merhaba, cevabınız için teşekkürler fakat genel olarak kullandığınız soundtracklar (güncel) bunları merak ediyorum. ücretli yada ücretsiz olsun farketmez bilgilendirirseniz çok sevinirim 🙂

Bariş bey. Bu videonuzdaki sarı aydinlatma kullanilmiş galiba. Ogrenmek istediğim bunu kurguda mi sari tonlama yaptiniz yoksa kullandiginiz işik 2200k değerlerinde mi ? Anladigim kadariyla tek tarafli isik kullanmissiniz. Led mi softbox mu bunu soylerseniz cok sevinirim. Çok mukemmel tasarlanmis işik .thanks

Merhaba Barış Bey. Öncelikle bize böyle güzel videolar ve metinler sunduğunuz için çok teşekkürler.

4K ve 4K HDR videolar ile takılmadan çalışabilmek için hangi yazılımları önerebilirsiniz?

Bu gibi haberlere nereden rastlıyorsun abi ilgimi çekiyor böyle şeyler ancak hep çok çok sonradan öğreniyorum bu tarz gelişmeleri

Abi Merhaba, Aslında çok bir yaş farkımız yok biraz büyüksün ama yine de yaptığın işe ve verdiğin bilgilere bakarak saygımı ancak bu şekilde ifade edebilirim. Yaptığın işten dolayı tebrik ediyorum ve iyi ki youtuber olmuşsun diye düşünüyorum. Çünkü bu şekilde bilgi birikimlerini bizimle paylaşıyor ve bizi her konuda aydınlatıyorsun. Eleştirilere ve gelişime açık olduğun için de ayrıca teşekkür ederim.
Çünkü ilk videolarına baktığımız zaman hem görüntü hem de konuların kalitesine göre olumlu yönde gelişim gösterdiğin açıkça görülüyor.
Sana bir sorum var: Videolarda kullandığın gözlük çerçeveleri değişiklik gösteriyor. Bu çerçeveleri konu kategorilerine göre mi yoksa o günkü ruh haline göre mi değiştiriyorsun. Ayrıca özellikle bu videoda kullandığın çerçevenin markası ve modelini öğrenebilir miyim.

Başarılarının devamını dilerim.

Merhabalar,

GAN (Generative Adversarial Network) için “Üretken Ters Ağ” tanımı yerine “Çekişmeli Üretici Ağ(lar)” kullanılıyor bildiğim kadarı ile. Siz bu tanıma nereden eriştiniz? En azından “Üretken Düşmanca Ağlar” tanımını kullanmadığınıza sevindim 🙂

Bir cevap yazın

E-posta hesabınız yayımlanmayacak.