Kategoriler
Genel

Böyle bir insan yok!

Böyle bir insan yok! Hiç yaşamadı. Böyle bir insan da yok. Bu insanlar size bir yerlerden tanıdık gibi geliyor olabilir. Ama bu yüzlerin hiçbirini daha önce görmediniz. Çünkü bu insanlar hiç yaşamadı. 

O gördüğünüz fotoğraflar, bilgisayar kodlarıyla satır satır, piksel piksel üretildi. Bu videoda sadece onların nasıl yapıldığını değil, bu yöntemin bilgisayar yazılımcısı olmasak bile hayatımızda nasıl işe yarayabileceğini anlayacağız. 

Makineler yıllardır gördükleri fotoğrafları tanımayı ve tanımlandırmayı öğrenmeye çalışıyor. 2013 yılında bu konuda insan seviyesine ulaşmayı başardı. Artık böyle bir fotoğrafa bakınca bir at, onun üzerinde bir insan ve onun da kafasında bir kask, bir binici togu olduğunu ayırt edebiliyor. 

Bu sayede mesela çektiğim fotoğrafları ve videoları yüklediğim Google Photos’da özellikle İngilizce arama yaptığımda gerçekten çok detaylı sonuçlara ulaşabiliyorum. Makine öğrenmesi sayesinde yüklediğim fotoğraf ve videoların içinde gemi olduğunu anlamakla kalmıyor, kelimeyi en geniş anlamıyla değerlendirip uzay gemisini bile bir sonuç olarak gösteriyor. Dahası çektiğim kitap sayfalarındaki gemi illüstrasyonlarını da rahatlıkla buluyor. 

Öte yandan çok kolay tuzağa da düşürülebiliyor. Aynı Google Photos 2015’de fotoğrafları gruplandırırken şöyle bir fiyaskoya imza atmıştı. Makine öğrenme algoritmaları bir elmayı rahatlıkla tanıyabilirken, aynı elmayı bir file torbanın içine koyarsanız onun ne olduğunu anlayamıyor. Çünkü bu beklenmedik, sıra dışı bir görsel. 

İşte onun bu kandırılmaya yatkın doğasını fark eden kişilerden biri bu konularda çalışmalar yapan bir öğrenci: Ian Goodfellow. 2014 yılında Kanada Montreal Üniversitesi’nde kendisi ve arkadaşları bu zayıflığı bir avantaja dönüştürmek üzere oyun teorisini de kullanarak yeni bir makine öğrenmesi sistemi geliştirdiler: Generative Adversarial Network – GAN. Bir kaç ay önce yaptığım bir videoda bu sistemi kullanan Nvidia’nın geliştirdiği GauGAN adlı bir yazılımdan söz etmiştim. O zaman bu sisteme “üretken ters ağ” demiştim, ancak bu konuda yapılan Türkçe akademik çalışmalarda da rastladığım “çekişmeli üretici ağ – ÇÜA” tabiri konuyu çok daha iyi tarif ediyor. 

Bu yeni sistem o kadar önemli ki makine öğrenmesini en çok kullanan şirketlerden Facebook’un yapay zeka araştırma yöneticisi bile onu öve öve bitiremiyor: “çekişmeli eğitim, gerçekten, gerçekten, gerçekten çok havalı bir fikir. Makine öğrenmesinde son 20 yılda bulunan en havalı fikir.” 

Neden bu kadar önemli biliyor musunuz? Bugüne kadar makine öğrenme sistemleri karmaşık bir girdiden basit bir çıktı almayı sağlıyordu. Google Photos örneğinde yüklediğim o fotoğraf ve videolar karmaşık girdileri (input) temsil ediyor. Bunları öğrenen makine, nöral ağını kullanarak ne yapıyor? Basit bir çıktı üretiyor. Görseli inceledikten sonra bir “gemi” etiketi gibi bir çıktı (output) bu. Yeni geliştirilen “çekişmeli üretici ağ” ise bunun tersini başarabiliyor. Basit bir girdiden karmaşık bir çıktı üretebiliyor. Bir taraftan bilgisayara rastgele sayılar veriyorsunuz, öbür taraftan son derece karmaşık ve gerçekçi insan yüzü fotoğrafları çıkıyor. Yani makine sadece öğrenmiyor, aynı zamanda üretiyor. Üreterek öğreniyor! Kendi adımıza çıkartacağımız ilk ders bu olsa gerek. Bir şeyi iyi öğrenmek için önce onu üretmeyi deneyebiliriz. Resim çizmeyi öğrenmenin en iyi yolu hemen resim çizmeye başlamak. Ama sadece bu yeterli değil. Herhangi bir projede ilk yapacağımız denemelerde başarılı olmak ya da bu örneğimizde gerçekçi bir resim çizebilmek mümkün değil. Başka ne lazım?

Makine öğrenmesinde kullanılan “çekişmeli üretici ağ” GAN modelimize geri dönelim. Evet burada üretici bir ağ var ve bu ağ rastgele bir gürültüden hemen resmi çizmeye başlıyor. Ama onun yanında çalışan bir başka ağ daha var. Buna ayırımcı ağ deniyor. Üreticinin oluşturduğu görselleri inceleyen bir ağ bu. Onların gerçekçi mi yoksa sahte mi olduğuna karar veriyor. Bu iki nöral ağı bir oyundaki yarışmacılara benzetebiliriz. Aralarında sürekli bir çekişme var. Üreticinin bu oyundaki amacı ayırımcıyı kandırmak ve ürettiği görselin gerçek olduğuna inandırmak. Ayırımcının amacı da gerçek görsellere bakarak mümkün olduğu kadar çok sahte görseli ayıklamak. Yani aynı yazılım bir yandan üretim yapıyor, bir yandan da kendi ürettiklerini acımasızca eleştiriyor. Kendini sürekli geliştirebilmek için kullanılabilecek basit ama etkili bir teknik.  

Bunu şu adrese girerek hemen siz de deneyebilirsiniz. Yarışmacı nöral ağlarımız her seferinde 5 adımda birbirlerine karşı yarışarak karmakarışık noktaları düz bir çizgi ya da bir çember yapmak üzere birbirlerini eğitebiliyor. Eğer denerseniz sizin de fark edeceğiniz gibi böylesi basit çizimleri öğrenebilmek bile bilgisayarın binlerce deneme yapmasını gerektiriyor. Bir de üstteki örnek çizgi ya da çember yerine gerçek insan fotoğrafları verdiğinizi düşünün. 2014’de bu sistem geliştirildiğinde çok düşük çözünürlüklü ve siyah beyaz bir fotoğraf üretilebilmişti. Aradan geçen 5 yılda yapay zekanın sentezleyebildiği fotoğraf kalitesi giderek arttı. 

Bu 5 yılda makine öğrenmesi konusunda araştırma yapanlar GAN tekniklerini hem geliştirdiler hem de çok farklı alanlarda uygulamaya başladılar. Mesela bilgisayarlar artık karton karakterler, anime karakterleri üretebiliyor. PokeGAN projesi yeni Pokemon karakterleri tasarlıyor, eski karakterlere bakarak. PGerçi pek başarılı olduğu söylenemez. CycleGAN projesi taslak çizimleri fotoğrafa dönüştürüyor. Tıpkı daha önce tanıttığım GauGAN gibi. Ressamların stillerini öğrenip fotoğrafları tablolara ya da uydu fotoğraflarını haritalara dönüştürebiliyor. StackGAN projesi yazıyı görsele dönüştürüyor. Mesela bana “kısa gagalı, siyah ve yeşil küçük bir kuş” lazım yazıyorsunuz ve size böyle bir kuş görseli üretiyor. Bakın buluyor demiyorum, yazdıklarınızdan görsel üretiyor. Gerçekte bu kuşlar da yok. Başka bir proje hangi açıdan çekilmiş olursa olsun yüzünüzün önden görüntüsünü üretiyor. Moda endüstrisinde kullanılabilecek başka bir çözümde modellerin verdiği pozlar değiştirilebiliyor. Fotoğraftan emoji üreten de var, 3 boyutlu modelleme yapan da.

Peki 5 yıl gibi çok kısa bir sürede bu kadar büyük ilerleme kaydedilmesini neye bağlayabiliriz? Çünkü bu konu sadece teknolojinin ilerlemesiyle ilgili bir durum değil. 

Şimdi size bir grafik göstereceğim. İnternette üretilen datanın miktarını gösteriyor. Dikkatinizi çeken bir şey var mı? 2010’dan itibaren ürettiğimiz verilerde adeta bir patlama yaşanıyor. GAN tekniğiyle makine öğrenmesinin 2014’den beri giderek daha başarılı olmasının en önemli sebeplerinden biri de bu. Son 5 yılda bizim gibi sıradan kullanıcılar, çektiğimiz fotoğrafları ve videoları internete, sosyal medya platformalarına yükleyerek örnek verilerin sayısını ve çeşitliliğini inanılmaz ölçüde artırdık. 

Nasıl oluyor da bu kadar çok veri üretmeyi başarabiliyoruz? Sebebi çok basit. Bir gün biri çıkıp insanların fotoğraflarını yaşlandıran FaceApp diye bir uygulama geliştiriyor. Ertesi gün sosyal medyada yaşlanmayan kalmıyor. Sadece böyle bir uygulama sayesinde bir haftada yüz milyonlarca fotoğraf yüklenmiş oluyor. Umalım ki bunlar sadece makine öğrenmesi için kullanılıyor olsun. Çünkü uygulamayı kullanmak için kabul ettiğimiz ama okumadığımız sözleşmede o fotoğrafların tüm haklarını, süresiz olarak uygulamayı geliştiren Yaroslav Goncharov’a vermiş oluyoruz. Ben kendisini tanımam. 

FaceApp’a, kullanmak, çoğaltmak, değiştirmek, uyarlamak, yayınlamak, tercüme etmek, türetmek, türev işleri yapmak, dağıtmak, halka açık bir şekilde göstermek için kalıcı, geri alınamaz, münhasır olmayan, telif hakkı olmayan, dünya çapında, tamamen ücretli, devredilemez, alt lisanslanabilir bir lisans vermektesiniz. 

Hemen panik yapmayın. Bir cep telefonunuz varsa ve sosyal medyayı kullanıyorsanız bugüne kadar FaceApp’inki kadar aşırı olmasa da buna benzer onlarca sözleşmeyi çoktan kabul etmişsiniz demektir. 

FaceApp, makine öğrenmesini ve GAN tekniğini kullanan uygulamalardan sadece biri. Bugün geldiğimiz noktada artık üretici nöral ağlar görselleri birer stiller kümesi olarak algılıyor. Bir fotoğraftaki insanın pozunu, duruşunu, saçını, yüz şeklini, gözlerini, ten rengini ayrı ayrı öğrenip bunlardan yeni fotoğraflar üretebiliyor. Yani kendinizi sadece yaşlandırmakla kalmayıp, cinsiyetinizi, ırkınızı, ten renginizi ve daha pek çok fiziksel özelliğinizi değiştirebilirsiniz.

Hemen herkesin kullandığı FaceApp’den önce bazı kişilerin bilip çok az kişinin kullandığı FakeApp vardı. FakeApp özellikle ünlülerin videolarını yine GAN teknikleriyle birleştirip onlara hiç yapmadıkları şeyleri yaptırabiliyor. Derin sahte anlamına gelen “Deepfake videoları.” Bu videoları üretenler özellikle Nicolas Cage’e yapmadıklarını bırakmadılar. Charlie Sheen’den Elon Musk yaptılar. Jennifer Lawrence’ı Steve Buscemi’ye dönüştürdüler. Politikacılara hiç söylemedikleri şeyleri söylettiler.

Deepfake videolarını üretebilmek için yine GAN tekniğiyle makinelerin öğrenmesi gerekiyor. Gördüğümüz örnekler her ne kadar etkileyici olsa da aslında var olan iki görüntüyü birleştirme aşamasında. Yani videonun başında gösterdiğim fotoğraflardaki gibi hiç olmayan görüntüleri üretemiyor. Henüz. 

Birkaç ay önce bu konuda da çok önemli bir gelişme yaşandı. Samsung’un yapay zeka laboratuvarlarında geliştirilen bir teknikle tek bir fotoğraftan video üretmek mümkün hale geldi. Normalde makine öğrenmesinde çok miktarda veriye ihtiyaç duyulduğunu söylemiştik. Burada bilgisayara öğrenmesi için sadece bir görsel vermek bile yeterli oluyor. Bilgisayar bunu temel yüz hareketleriyle birleştirerek basit bir video üretebiliyor. Tabi daha fazla fotoğrafla beslerseniz sonuç daha inandırıcı oluyor. 1 fotoğraf yerine 8 fotoğraftan öğrenen bilgisayarın ürettiği görüntü bu. Muhtemelen yakın bir gelecekte cep telefonumuzla çektiğimiz selfilerden otomatik videolar üretebileceğiz. Ya da kameramızı açıp kendi yüz ifademizle bir fotoğrafı kukla gibi oynatabileceğiz. Bu birisinin fotoğrafı da olabilir. Ünlü bir tablo da…

 

“Böyle bir insan yok!” için 22 yanıt

barış abi keşke videodaki konularla ilgili fikirlerini bizlerle paylaşsan bu teknoloji hakkında ne düşünüyorsunuz merak ediyorum.

barış abi fotoğraflara gerçeğe yakın görüntüyü elde edebiliyolar aynı şekilde sesi de benzetmeleri mümkün mü

Videonun sonunda çalan şarkı çok hoşuma gitti. İnternet üzerinde bulunan sesli arama uygulamalarından falan arattım ama herhangi bir sonuçla karşılaşamadım. Acaba sondaki müziğin ismi ne?

Merhabalar Barış Bey, bir video konu önerisinde bulunacaktım.
Yaşadığımız bu bilgi fırtınasına dönüşmüş dünyamızda ‘DOĞRU BİLGİYE NASIL ULAŞABİLİRİZ ?’. Çevremden aldığım geri dönüşlerden vardığım sonuç; çok fazla insan bunun cevabını bilmiyor ve herhangi bir araştırma sonucunda geriye ‘KARIŞIK BİR BİLGİ SİSİ’ kalıyor.

Çok fazla kaynaktan araştırarak ve de konu hakkında bilgisi olan kişilere danışarak. Bunun cevabı çok basit. Bu kadar kasacak bir şey yok. Ayrıca buraya yorum atacağınıza YouTube videosuna yorum atsanıza aq.

Merhabalar Barış Bey, ben bir video önerisinde bulunacaktım.

Çevremden aldığım geri dönüşler sonucunda çoğu kişinin ‘GÜNÜMÜZ BİLGİ KİRLİLİĞİNDE DOĞRU & GÜVENİLİR BİLGİYE NASIL ERİŞİLİR?’ konusundan muzdarip olduğunu görüyorum. Bu konuda bizi aydınlatabilirseniz çok faydalı olacağını düşünüyorum.

Yapmaya çalıştığınız şeyi çok takdir ediyorum.
Saygılarımla

Bu programların yazılı olduğu açık bir kütüphane var mı acaba? İçlerinden birisi Harita mühendisliği yüksek lisans tezim için yeni ve güzel bir yöntem oluşturabilir. kısa sürede bu verilere ulaşıp tezimde uygulayabilrsem güzel bir tez ortaya koyabilirim. Mesajımı görüp, geri dönüş yaparsan çok sevinirim Barış abi👍

Barış Bey konuyla ilgili videonuz gerçekten olabildiğince sade, derin öğrenme(deep learning) de ki bu tekniği güzel anlatmaşsınız.
Konuyla derinlemesine ilgilenen yazılım , derin öğrenme mühendisleri ve araştırmacılar için kaynak kodları içeren projemi sizlerle paylaşmak istiyorum:
https://github.com/enginBozkurt/deep-learning-nanodegree/tree/master/Project-4%20Face%20Generation
Not : Training aşaması çok kısa tutuldu. Arkadaşlar siz daha fazla training aşamasını uzatarak ve bazı teknik nüanslarla daha iyi sonucu alacağınıza eminim.
Direkt olarak bu adresten de https://colab.research.google.com/drive/1lMDT9Rq0Ioy85_ZPnx5wRw3e7dJXxaQa indirerek dosyayı Google Colab’da kullanmaya ve yapay zeka modellerinizi geliştirmeye başlayabilirsiniz.
Umarım çalışmalarınıza yardımcı olur.

Black Mirror’ın 4. sezonda robotlu bir bölümü vardı, siyah robotlar, onlara ‘dog’, ‘köpek’ demişlerdi, o bölümün anlamını anlatır mısın? 🙂

Abi videoların çok güzel ama yeterince iyi anlayamıyoruz anlatmak istiyorsun ama anlatım dili biraz zayıf kalıyor. Birde bize jules verne hakında bir video yaparmısın

Barış abi merhaba. Bir sorum olacaktı
Güncel ve güvenilir bilim haberlerini takip edebileceğimiz bir uygulama bir site var mıdır?
Senin önerini merak ediyorum.

Merhabalar, Bu konu üzerine yüksek lisans tezimi yapmaktayım, video yapımında kullandığınız kaynakçayı paylaşabilir misiniz lütfen?

Barış Abi lise 1 gidiyorum ingilizce mi nasıl geliştiririm yani kelime dağarcığımı ve konuşalanları anlamamı

Merhabalar! Barış Abi yardımcı olmanı istediğim bir konu var. Five feet apart gibi çok güzel bir kitap okudum. Fakat o kitapa benzer kitaplar bulmakta zorlanıyorum yaz bitiyor. Okullar başlıyor. “90 günde okunabilecek 12 kitap” adlı videodan birtane daha hazırlaman mümkün müdür acaba? Mümkünse çok mutlu olurum. Saygılar.

Barış abim bir hafta gerçekten uzun bir süre… Vaktin kısıtlı biliyorum fakat özletme kendini… Gel şu işi hafta da 2 video yapalım… Bizler için biraz daha yorulur musun☺️

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir