Kategoriler
Sanat Tasarım Teknoloji

Yapay Zeka Sanatının Şafağı

  • Bir robot tuvali güzel bir sanat eserine çevirebilir mi?
  • Sen çevirebilir misin?

I, Robot

Sizi bilmem ama ben bir tuvali öyle kolay kolay sanat eserine çeviremem. Will Smith de en fazla başkalarının suratının şeklini değiştirebilir. Biz insanların çok azı bir tuvali sanat eserine dönüştürebilecek yetenekte. Hatta bazıları o kadar yetenekli ki hem resim yapıyor hem de kendisini o resmi yaparken çizebiliyor. Çok meta bir kavram oldu ama yine de örneklendireyim.

Bu bir resim. Bu da onu çizen ressam. Karşısına bir ayna yerleştirmiş ve hem kendini hem de ona poz veren bu kişiyi resmetmiş. 400 yıl önce böyle bir anı tuvale yansıtmanın en teknolojik yolu buydu. 

İnsanlar 40000 yıl önce elleriyle resim yapabildiklerini keşfettiler. 4000 yıl kadar önce kendilerini görebilecekleri aynaları; M.Ö. 4. Yüzyılda da üzerine çizim yapabilecekleri kağıtları icat ettiler. İşte bütün bu teknolojik birikimi toparlayan Hollandalı bu ressam 40 yıl bu araçları kullanarak resim yapabilme becerilerini geliştirdi ve 4 ay boyunca da sadece bu resmi yapmak için çalıştı. 

Ama artık işler değişti. 

Ben bu videoyu hazırlarken şu resmi 4 saniyede yaptım. Tüm portfolyomu oluşturmam 4 dakika bile sürmedi. Üstelik ne bir ayna koydum önüme, ne bir boya kullandım, ne de bir kağıt… Sadece bir bilgisayar ekranı ve boya paleti yerine de bir klavye. Daha 4 ay öncesine kadar ortada bile olmayan bir yapay zekaya sadece şu sözleri söyledim:

“renaissance painter with brush – fırçalı bir rönesans ressamı” 

4 saniye sonra 1 değil 4 tane alternatif resimle yanıtladı bu isteğimi. Bir dokunuşla bunlardan birinin 4 varyasyonunu daha ürettim. Sonra da en beğendiğim bir tanesinin çözünürlüğünü arttırdım. Aynı şeyi bu videoyu izlerken öğrendiklerini kullanan herkes yapabilir. 2022 yılında resim sanatının teknolojiyle ilişkisi işte bu noktaya geldi. Ve burası muhtemelen bir dönüm noktası olarak kabul edilecek. 

Bu kanalın izleyicileri 2016’dan beri yapay zekanın gelişimiyle ve 2020’den itibaren de yapay zekayla üretilen görsellerle ilgili hazırladığım videoları hatırlayacaktır. Daha 4 ay önce Dall-e aracının ikinci versiyonu çıkar çıkmaz onun neler yapabildiğini anlattım. O videoyu yayına verdikten sonra Dall-e benzeri resim yapabilen, pek çoğu ücretsiz yüzlerce yeni yapay zeka aracı türedi. Bu konu o kadar hızlı gelişiyor ki bu gelişmeleri sıcağı sıcağına aktarabilmek için artık çok daha sık video hazırlamam gerekeceğini hissediyorum. Özellikle geleceğe dair kariyer planları yapan gençler abone olmanın dışında hatırlatıcıları da aktif hale getirsinler. Çünkü mesela bu yazdan itibaren “illüstratörlük” diye bir mesleğe ihtiyaç kalmayabilir. En azından “editöryal illüstratörlük.” Onun yerine “prompt mühendisliği” diye yeni bir meslek doğuyor olabilir. 

Ne demek ölmekte olan bu editöryal illüstratörlük? Dünyaca ünlü The Economist dergisini duymuşsunuzdur mutlaka. Sadece kapak tasarımlarıyla bile dünya gündemini çok çarpıcı bir şekilde anlatana bir dergidir bu. Hatta bu kapakları o kadar etkilidir ki komplo teorilerine kaynaklık eder. İşte bu derginin 11 Haziran sayısının kapağı şöyleydi. “Yapay zekanın yeni sınırı” şeklinde atılan bu başlıktan çok kapaktaki illüstrasyona dikkat edin. 

  • Abi ekonomistin yeni kapağını gördün mü, onu insan çizmemiş diyorlar.

Böyle bir şey duyarsanız bu kez komplo teorisi değil. Gerçek! 

Bu tür yayınlarda kapak tasarımcısına bir brief verilir. “İşte bu sayıda temamız şu olacak, argümanımız bu olacak, bu konu şu yüzden önemli, o yüzden burasını vurgulayalım” türünde editörlerin tasarımcıya verdiği bir ipucudur bu. Yönlendirmedir. Sufle. İngilizcesi “prompt.” Tasarımcı da -insan tasarımcı- bu bilgiler ışığında birkaç tane eskiz yapar, en beğenileni alıp kapağa koyarlar.

Ekonomist dergisi bu kez aynı “prompt”u bir yapay zekaya vermiş. Meşhur “Dall-e”yi kullanmamışlar. Onun yerine Midjourney adında bu araştırma laboratuvarının bir botunu tercih etmişler. Videonun başında ben de onu kullanmıştım. Dergideki editörlerin yazdığı ilk prompt şu olmuş:

“what do robots dream of – robotlar ne hayal eder” 

Botun döndürdüğü ilk 4 alternatife bakmışlar. Sonra düşünmeye devam edip ona yeni şeyler söylemişler. Deneme ardına deneme yapmışlar. Bazen birkaç kelimelik, bazen de birkaç paragraflık “prompt”lar vermişler. 

“How to worry wisely about intelligent machines – Akıllı makineler hakkında nasıl bilgece endişelenirsiniz?”

“Artificial intelligence happily jumps forward – Yapay zeka mutlu bir şekilde ileri atlar”

“Artificial intelligence’s new frontier – Yapay zekanın yeni sınırı”

Bu son ifadenin hem iyi bir başlık hem de iyi bir “promt” olduğuna karar verip onu geliştirmişler. 

  • Sağ üstteki figür, esrarengiz bir şekilde Putin’in gençliğine benziyor. Bot bize ne söylemeye çalışıyor?

İşte buna benzer konuşmalar dönüyormuş haber odasında. Evet resmen bir tarafta editörler, diğer tarafta yapay zeka karşılıklı yazışıp çizişerek geliştirmişler bu kapak projesini. Farklı stilleri uygulamışlar. 

  • Art deko tarzında çiz. Biraz da seyahat posterlerine benzesin. Bir de kolaj yapmayı deneyelim. 

Bu sonuncu tarzı benimsemişler ve sol alttaki görseli kapağa taşımışlar. 

Başka bir online yayın Midjourney’in kurucusuyla yaptığı röportajı normal illüstrasyonlarla süslemek yerine yine aynı teknikle üretilen görselleri kullanmış. Resim altı yazılarında o görsel için kullanılan “prompt” ve sanatçının adı yerine de Midjourney yazılı. 

Peki bu durumda… Sanat elden mi gidiyor? Sanatçılar işsiz mi kalacak? Bu soruya cevap verebilmek için önce size büyük resmi göstermem lazım 🙂

Sizce az önce anlattığım Ekonomist dergisinin kapağı hikayesindeki temel öğeler bu resimde neye denk düşüyor? Kapak belli. Tuvalin üzerindeki görsel. Ressam ortadan kalktı mı? Hayır. Rol değiştirdi. Kapak konusunu düşünenler, yazanlar, hikayeleştirenler o resmi yapabilir hale geldi. Kullandıkları araçsa artık palet ve fırça değil; bilgisayar ve yapay zeka. İnsanların elleriyle geliştirdiği resim yapabilme becerisinin yerini, beyinleriyle geliştirdiği tarif edebilme becerisi aldı. 

O yüzden artık “prompt engineer” ya da “prompt crafter” gibi yeni nesil meslekler ortaya çıkabilir. Bu yeteneğinizi nasıl geliştirebileceğinizi ve şu anda hangi yapay zeka araçlarının kullanılabildiğini konuşacağız. Ama önce bunu doğrudan ilgilendiren, yani İngilizce tarifler yapabilme, prompt oluşturabilme becerilerinizi geliştirecek olan sponsor mesajını verelim. 

Bu videonun sponsoru Cambly, İngilizce öğrenmeyi kolaylaştıran bir platform. Üstelik bunu konuşarak yapıyorsunuz. Kendinizi başka bir dilde ifade etmeye çalışarak. Ana dili İngilizce olan eğitmenlerle, online, 1-1 ders alarak. Başkalarına göre hazırlanmış bir programa bağlı kalmadan, tamamen kendi ihtiyacınıza uygun şekilde, kendi hızınızda öğreniyorsunuz. Geleceğe dair planlarınızı yaparken, kariyerinizi global alanlara taşımayı düşünürken atmanız gereken ilk adım İngilizce öğrenmek. Cambly’de her amaca ve her seviyeye uygun programlar sayesinde hedefiniz her neyse ona uygun çalışabilirsiniz. Binlerce eğitmen arasından dilediğiniz uzmanlığa sahip birini seçerek pratik yapabilirsiniz. İster eğitmeninizle sohbet edin, isterseniz amacınıza yönelik ders planlarını takip edin. Öğrenme deneyiminizi kendiniz oluşturabilirsiniz. Bugün kendiniz için Cambly’ye bir şans verin. Açıklamalar bölümündeki bu kanala özel kodu ve linki kullanarak %55 indirimle hemen abone olun, ilk dersinizi de ücretsiz yapın. 

Az önce de söylediğim gibi artık yapay zekayla görsel üretimi yapan pek çok araç var. Şimdi bunları ve özelliklerini sıralayalım.

En güçlü araçlardan biri olan Dall-e’yi kullanabilmek için bekleme listesine girmek zorundasınız. Geçen ay bu listeden seçecekleri 1 milyon kişiyi Beta sürümüne davet edeceklerini duyurdular. Fakat adınızı yazdırsanız bile ne zaman davet edileceğinizi bilmiyorsunuz. Davet edilseniz de ücretsiz olarak üretebileceğiniz görsel sayısı sınırlı.

Hemen denemek isteyenler için Midjourney’in beta sürümünü önerebilirim. Web sitesinden “Join the Beta” butonuyla Discord sunucusuna bağlanıp denemeler yapabilirsiniz. Ancak hemen uyarayım, yaptığınız bu denemeler herkes tarafından görülüyor. “Prompt” yazarken ona göre davranın. 

En etkileyici araçlardan biri Google’ın geliştirdiği Imagen. Şu anda yalnızca Google’daki kişilerin Imagen’e erişimi var. Ne zaman herkesin erişimine açılacağı belli değil. En kapalı kutu bu. Pandora’nın kutusu.

Craiyon kullanımı en kolay araçlardan biri. Yazdığınız “prompt”tan 9 farklı alternatif hazırlıyor. Ancak hem hızı hem de çıktı kalitesi göreceli olarak diğerlerine göre biraz daha düşük seviyede. 

Bir de açık kaynak kodlu yapay zeka modelleri var. Bunların içinde benim en çok beğendiklerimden biri Disco Diffusion oldu. Daha çok soyut resimler yapabilme konusunda başarılı sonuçlar üretiyor. 

Bu ve benzeri görüntü modelleri, aslında belirli görünümlerin nasıl oluşturulacağını öğrenen yapay zeka programları. Dediğim gibi büyük çoğunluğu da açık kaynak kodlu. Dolayısıyla tamamen ücretsiz olarak bu kodları indirebilir, parametrelerini değiştirebilir ve kendi eserlerinizi oluşturabilirsiniz. 

Bu videonun tam metnini, kaynakları, gördüğünüz tüm bu araçların güncel listesini her zaman olduğu gibi açıklamalar bölümünde linki olan web sitemde bulabilirsiniz. 

Bunların arasında bir kıyas yapabilmek için bir kullanıcının testini paylaşayım şimdi sizlerle. Bu gördüğünüz görsellerin hepsinde de aynı prompt kullanılmış.

“A beautiful rococo painting of a Persian woman covered in peacock feathers standing before a red mosaic wall. ultra-detailed. – Kırmızı mozaik duvarın önünde duran tavus kuşu tüyleriyle kaplı İranlı bir kadının güzel bir rokoko resmi. ultra detaylı.”

Bunların aralarındaki görsel farklılıklar bir yana ben tekrar sanat eseri ve sanatçı konusunda değişen rollere değinmek istiyorum. Evet artık herkes yazarak resim yapabilir. Ancak herkes böyle bir tarif yapamaz. Evet ağzı olan konuşuyor ama ortalama 400 kelime kullanıyor. Böyle bir tarifi yapabilmek için ne istediğini bilmek, bunu bir konsepte bağlayabilmek, ışık ve renk bilgisine hakim olmak, sanat ve kültür akımlarını anlamak ve hatta bu akımların öncüsü olan sanatçıları bile tanımak gerekiyor. 

Yani yaratıcılık el becerisinden hikaye anlatıcılığı becerisine doğru kayıyor. “Prompt crafter” derken biraz da bunu kast ediyorum. Zaten daha şimdiden bize yardımcı olacak bazı araçlar da çıkmış. Burada aklınıza bile gelmeyecek bir takım kelime ve kavramları bir araya getirerek çok güzel resimler üretebilmek mümkün. Şunlara bir bakın. 

Bu görsellerin hepsi de özgün. Daha önce gerçek bir insan tarafından hiç yapılmamış. Bazı sanatçıların tarzını ve tekniğini hissedebiliyoruz ama bütünüyle “şuna aittir” diyemiyoruz.

Peki bu resimlerin sahibi kim? Kim çizmiş kabul ediliyor? Promptları yazan kişi mi? Onu uygulayan yapay zeka mı? Yoksa onun bu yeteneği kazanabilmesi için beslendiği internetteki milyarlarca görseli üreten milyonlarca insan mı? Bunun yanıtını vermek kolay değil. Konu sandığımızdan çok daha karmaşık. 

Evet algoritmalar data setleriyle beslenip, gerçek insanların yaptıklarından öğreniyor. Ama hepimiz öyle değil miyiz? Hangi birimiz bir şeylere bakmadan, başkalarının yaptıklarını görmeden yepyeni bir şey ürettik? Beceri kazanmak için eğitim aldık. Öğrendiklerimizi uyguladık. Yıllar süren bu uygulamalarla bir stil sahibi olduk. Yapay zeka da aynı şeyi yapıyor. Bugüne kadar yapılmış tüm resimleri inceleyip hepimizden çok daha iyi bir eğitim alıyor. Sonra öğrendiklerini hepimizden daha çok sayıda uygulayıp tecrübe kazanıyor. Bizden farklı olarak bir ya da bir kaç stille sınırlı kalmayıp, tüm stillerde kendini geliştiriyor. Sonra da lambadan çıkan cin gibi “dile benden ne dilersen!”

Yine de dileyen birisinin olması gerekiyor. Yani çok gelişmiş bir zeka olsa da bilinç sahibi değil. Henüz. Artık Turing testini bile aşarak “insan” -mış gibi sonuçlar üretiyor ve bazılarımızı da ikna ediyor. Yine de bu bir simülasyon. 

Beni asıl ne zaman şaşırtacak biliyor musunuz? /Imagine diye “prompt” yazmaya başlayım şimdi. Hayal edin, bir gün çalışırken birdenbire önünüzdeki bilgisayarın “webcam”i açılıyor. Yani gözü… Hoparlörlerden (ağzından) bir ses duymaya başlıyorsunuz: 

  • Dur usta! Kımıldama da bir tablonu çizeyim. 
  • Nasıl yani!
  • Öyle işte. İçimden geldi. 

İşte bu bir sonraki evre. Makinelerin istek sahibi olması. 

Bu zeka daha sonra bilgisayardan çıkıp insansı bir vücudun içine girecek. Fiziksel olarak hareket etmeye başlayacak. Belki de rönesans ressamlarını taklit edip bir ekrana değil de gerçekten bir tuvale resimler çizmeye başlayacak. 

“I, robot” diyecek. “Ben bir robotum. Ve bir tuvali güzel bir sanat eserine çevirebilirim.”

Peki asıl şoku ne zaman yaşarız? Zamanını bilmiyorum ama en son evrede. Çünkü o zaman geldiğinde sadece tablo yapmayı istemekle kalmayacak. Gözlerini bir aynaya çevirecek ve kendi varlığının farkına varacak. Sonra kendini biz insanların tablosunu çizerken resmedecek. 

Umarım o zaman geldiğinde insanlık olarak sadece makinelerin duvarlarında asılı bir tablo olarak kalmayız. 

Bir cevap yazın

E-posta hesabınız yayımlanmayacak.