Kategoriler
Gelecek Teknoloji Yapay Zeka

Sora 2 çıktı: Artık Kendinizi Her Videoya Koyabilirsiniz!

“Bu gördüğünüz görüntülerin hiçbiri gerçek değil” diye başlayan bu kaçıncı video olacak bilmiyorum ama bu kez sadece ben değil, siz de aynı şeyi söyleyeceksiniz. Üstelik bu kez gerçek olmayan görüntüler sizin kendi görüntüleriniz olacak, ve bunu bilerek, isteyerek, hatta severek siz yapacaksınız!

30 Eylül 2025. OpenAI, Sora 2’yi dünyaya saldı. Başlangıçta kısıtlı bir kitleye. Video ve ses üretiminde fiziksel olarak daha doğru, gerçekçi ve kontrol edilebilir bir yapay zeka modeli bu. Ancak bu kez bir de yanında Instagram ve TikTok benzeri bir sosyal medya uygulaması da çıkardı. İçinde “Cameo” özelliği var. Ses efektleri var. Ağızla senkronize olabilen diyaloglar var.

Başka ne var? Ha, bol miktarda Sam Altman deepfake’i 🙂

OpenAI yaptığı lansmanda bunu “video için GPT-3.5 olarak” tanımladı. Yani büyük bir sıçrama olarak. Ama ben buna “internet’in resmi olarak bittiği an” demek istiyorum, çünkü ona ilk erişim sağlayanlar daha 24 saat içinde Sora 2’yi neredeyse her şeyi yapmak için kullandı. Hatta yok canım artık bunu da yapmaz herhalde diyeceğiniz şeye kadar her şeyi. 

Sora 2, teknik olarak etkileyici bir yapay zeka modeli. Ama sadece teknik kalmaması, artık “sosyal” alana da girmesi bence bizi biraz endişelendirmeli. Çünkü bu sosyallik katmanı, trendlerin ortaya çıkmasını sağlıyor. Trendler “meme”leri, “meme”ler de kültürü besliyor (ya da zehirliyor). Şekillendiriyor. TikTok ya da Instagram öncesi dünyayla şimdiki arasında fark var ve bu fark dışarıda değil en çok içeride oluştu. Ve içerideki fark bazıları için iyi olsa da, zayıf olan bazılarının beyinlerini resmen çürüttü.

Karamsarlaşmadan önce iyi haberi verelim. Sora 2, önceki video modellerin aksine fizik kurallarına daha sadık. Kafasında kediyle artistik patinaj yapan sporcu üçlü aksel yaptığında hareketi başarıyla tamamlayabiliyor ve kedi yere düşse de eriyip kaybolmuyor. Bir adam paddleboard üzerinde geriye doğru takla attığında yerçekiminin etkileri harekete gerçekçi bir şekilde uyarlanıyor. Bir jimnastikçi denge aletinde taklalar atabiliyor. Bir kişi bacaklarını açarak 2 atın üzerinde durduğunda, bu üç canlının hareketleri de birbiriyle uyum içerisinde. Şimdi bize neden random, rastgele videolar gösteriyorsun dediğinizi duyar gibiyim ama tekrar hatırlatayım, bunlar gerçek dünyada çekilmiş videolar filan değil. 

Dedim ya bunlar yapay zeka modeliyle “üretilmiş” görüntüler. Bunları üretmek “generate etmek” teknik bir iş ve çoğu kişiye zor ve karmaşık geliyor, -du. Çünkü modelin yanı sıra bu kez sosyal medya uygulaması da var ve aynı şeyleri kendi görüntünüzle kolayca deneyebiliyorsunuz. Hatta abartıp gerçek dünyada yapamayacağınız şeyleri de yapabiliyorsunuz.

Duyduğunuz gibi artık videolarda ses de var. Sora 2, arka plandaki sesleri, insan konuşmasını, hayvan seslerini, ses efektlerini, görsellerle senkronize bir şekilde üretebiliyor. Ve bunu tek bir prompt’la yapıyorsunuz, bunu yapabilen bazı eski modellerde sesi sonradan eklemek gerekiyordu. Eski modeller derken Sora’nın ilk modeli zaten daha Şubat 2024’te çıkmıştı.

Şaşırma faslını geçtiysek, bunun nasıl kullanıldığını göstereceğim ama ondan önce yapay zeka yardımıyla gerçekten faydalı bir şey yapabilmenizi sağlayan sponsorumuzun mesajını vereceğim çünkü Black Friday nedeniyle güçlü bir fırsat da sunuyor, kaçırmak istemeyebilirsiniz.

Gelelim Sora’nın uygulamasına. https://sora.chatgpt.com/explore adresinden resmi olarak bu uygulamada üretilen görüntülerin küçük bir kısmını izleyebilirsiniz. Bunlarda Sora ekibinin kendi görüntüleri ve tabiki bol bol Sam Altman var. Filtreden geçmiş temiz diyebileceğimiz bir akış için merak edenler önce buraya bakabilir.

Uygulamayı indirip kullanmak pek kolay değil, şu anda yani ilk çıktığı Ekim 2025’in başı itibariyle epeyce bir kısıtlama var. Sadece ABD ve Kanada’daki, sadece iOS kullanıcıları, sadece davetiye koduyla kullanabiliyor. Bu kodu ben internetten araştırıp bir Discord kanalındaki kullanıcıdan buldum. Teşekkürler Toto. Ama eminim bir süre sonra kısıtları kaldırıp herkesin kullanabilmesini sağlayacaklardır, çünkü onlar açısından özellikle belli bir kitleye erişmenin en hızlı ve en güçlü yolu bu. Şu anda duvardaki çatlaktan sızan su akışını görüyoruz, barajın kapakları açılınca oluşacak gümbürtüyü hayal bile edemiyorum.

Çünkü bu kez farklı bir durum var. Kendi görüntünüz. Ve onu yüklemek çok kolay. Ekranda beliren üç sayıyı sesli olarak okuyup kafanızı sağa sola çeviriyorsunuz ve bu işlem 10-15 saniye filan sürüyor. Sistem videoyu yükleyip doğruluyor ve bunu senin “Cameo”’n olarak saklıyor. Yani yapacağı videolar için bu ilk videodaki görüntünü ve sesini kullanıyor. 

Tıpkı Instagram ya da TikTok’ta olduğu gibi bir sosyal medya profilin oluşuyor. Bu profilde paylaşım yapmanın tek yolu prompt yazmak yani yapay zekaya bir talimat vermek. Bu çok basit bir şey de olabilir, sofistike bir şey de. Benim ilk promptum şöyleydi: 

“@ozcanbaris, koi havuzunda beline kadar suya batmış halde bo-staff kata yapan bir dövüş sanatçısıdır.”

DNA’mda %0.5 kadar da olsa Japonluk var tabi biraz. DNA’mda “polidaktili” yok gerçi ama yine de 6 parmak koymuş Sora; olsun, başlangıçta özellikle ellerde hep sorun yaşanıyor yapay zekada. Bu el problemi yapay zekada da robotlarda da en önemli problemlerden biri. 

Bu sadece bir sosyal medya uygulaması olduğu için gülüp geçiyoruz tabi. Biz gülüp geçerken o sizin yazdığınız “Prompt”un niyetini okuyor ve çok da iyi anlıyor. Viral trendleri veya çizgi film karakterlerini olağanüstü şekilde kopyalayabiliyor. En popüler olanlar şu an Pikaçu, South Park ve Spongebob klipleri. Hatta şaka yazmanıza bile gerek yok; sadece “komik bir nokta nokta videosu” yazıyorsun, o noktaları kendisi doldurup üretiyor. İnsanları veya kurgusal karakterleri Minecraft gibi video oyunlarının içine koyabiliyor .

Ünlü filmlerin içine kendinizi yerleştirebiliyorsunuz. Yaptığım ilk denemelerde ben telif haklarına takılır endişesiyle biraz dolambaçlı bir yol izledim. Mesela Godfather filmini, içinde “godfather” kelimesi geçmeden tarif etmeye çalıştım ve sonuç böyle oldu, yani niyetimi gayet iyi bir şekilde anladı. 

Ürettiği bazı kliplerde gözlüklerim olmadan beni üretti, oysa ben gözlüklü bir video yüklemiştim en başta. Bu da şaşırtıcı çünkü gözlüksüz olarak gerçekten de öyle gözüküyorum. Bunu fark edince bir de gözlük çıkarma sahnesi ekledim. Bir de güneş gözlüğüne çevirmeyi denedim. Işığın karanlık camın ardındaki gözleri ortaya çıkarmasına kadar her ayrıntıyı halletti. 

Bir de bazı şeyleri yapmaya zorlayabiliyorsun. Örneğin ben gözlüksüz videolarımın üretilmesini istemiyorsam bunun için Cameo özelliklerimi kontrol edebiliyorum. Ya da cinsel kimliğimi deklare ederek onun değiştirilmesini engelleyebiliyorum. 

Cameo’nun yani sizin görüntünüzün kimler tarafından kullanılabileceği de tamamen sizin kontrolünüzde. Yalnızca seçtiğiniz kişilere izin verebiliyorsunuz. Ayrıca ayarlardan sizin Cameo’nuzla üretilmiş tüm videoları görebiliyorsunuz, yayınlanmamış taslaklar dahil olmak üzere. Ya da kendiniz dışında kimsenin üretmemesini sağlayabiliyorsunuz. 

Uygulamada bir de Remix özelliği var. Eğer iyi prompt yazamıyorsan, hoşuna giden bir promptun varyasyonlarını oluşturabiliyorsun. Örneğin biri bir köpeğin polis tarafından çevrildiği bir bodycam görüntüsü yaptı. İzleyiciler başka şeyler koyarak promptlarla remikslerini üretti. Kullanıcılar orijinal klibin farklı varyasyonlarını yatay kaydırarak görebiliyor. Çoğu zaman remiksler orijinalinden daha komik oluyor.  

Önünüze düşen akış özelleştirilebiliyor. “For You”, “Latest”, “Following” veya “Pick a Mood” seçenekleri var. Dolayısıyla sadece aile ya da arkadaş grubu içinde paylaşılabilecek ve takipleşilecek bir sistem kurulabilir ama yine de paylaşımlara teknik olarak herkesin erişebilmesi mümkün. Çünkü “Search” bölümünden hesap arayabiliyorsun ve trend videolarını görebiliyorsun.

Benim bugüne kadar kullandığım en iyi image-to-video aracı olduğunu söyleyebilirim. LLM’ler çıkmadan önce deepfake üzerine videolar hazırlarken bazı denemeler yapmıştım ve 10 saniyelikbir şey üretmek o zamanlar çok güçlü bir bilgisayarla bile saatler sürüyordu. Şimdi çok kısa bir görüntüyle, 1 dakikadan kısa bir sürede 10 saniyelik videoyu cep telefonuyla yapabilir hale geldik. 

Yine de rakipsiz değil Sora 2. Runway Gen-3’te gelişmiş kamera kontrol özellikleri var mesela, kullanıcılar altı farklı kamera hareketi kullanabiliyor. Yani sinematik hassasiyet istiyorsanız, Runway hâlâ önde.

Google’ın Veo 3’ü hakkında daha önce bir video yapmıştım.  Çıktı kalitesi konusunda Sora ile başa baş, ama çözünürlük konusunda Veo hala önde. Tabi sosyal medya için çözünürlük pek de önemli değil. Öte yandan Veo’ya erişim hala çok kısıtlı, bekleme listesinde takılıp kalabilirsiniz. Şu an için Sora’da da aynı problem var ama daha hızlı deploy edeceklerini tahmin ediyorum hele Nvidia’yla yaptıkları son anlaşmayı da düşünecek olursak donanım konusunda bir atılım gelebilir.

Peki Sora bunları nasıl yapıyor? Yani nasıl eğitildi acaba? Gerçi yapay zeka çağında eğitim dediğimiz şey çalmanın kibarcası oldu galiba değil mi? 

Sora 2’nin sosyal medya klipleri, reelleri üzerinde eğitildiği çok belli. Hızlı kesmeleri, “amatör” telefon çekimlerini, hatta canlı yayın overlay’lerini ve sohbet ekranını bile taklit edebiliyor. Ses üretimi Grok Imagine’ın fersah fersah ötesinde, Veo 3’ten de iyi. Peter Griffin veya Eric Cartman gibi çizgi karakter seslerini çok başarılı yapıyor. Ama iş sizin sesinizi taklit etmeye gelince bunda pek de iyi değil. Çünkü sadece üç tane sayıyı okutarak sesinizi duyuyor ve bu kapsamlı bir eğitim için yeterli değil. Benim sesimi çok farklı tonlarda sentezledi ve Hint aksanından, Rus aksanına kadar bir çok farklı şekilde sundu. Yani seste bir tutarlılık sağlayamadı. Aynı kliplerin üzerine dubbing yaparak (kendi sesimi ekleyerek) inandırıcılığını arttırabilirim. 

Uygulamanın bu eksiklerinin yanı sıra başka eksileri de var. Bir kere varlığını trendlere ve “meme”lere yaslamış durumda. Viral trendler çok hızlı bayatlıyor. Bunun nedeni, herhangi bir viral klibin kopyalanmasının aşırı kolay olması. Bir stil popüler olur olmaz yenilik cazibesini yitiriyor.

Yüz/kimlik doğruluğu bazen gerçekten çok zayıf. Bu büyük ölçüde ilk Cameo kaydının kalitesine ve sahnenin karmaşıklığına bağlı.

Şu an için telif kontrolleri saçma sapan. Pikachu gibi, şirketlerin çok hassas olduğu karakterler bolca kullanılıyor. İnsanlar “Nintendo bana dava açmaz umarım” diye esprili klipler bile üretiyor. Bu durum OpenAI’nin, yılın başında ChatGPT görsellerinde olduğu gibi, modeli sıkı şekilde sansürlemesine yol açabilir.

Ama bir yandan da zaten bambaşka konularda aşırı duyar kasıyor. İlk gün 100’den fazla deneme yaptım. Normalde Pro kullanıcılar için 24 saat içinde en fazla 100 üretime izin veriyor ama dediğim gibi ben 100’den fazla deneme yaptım çünkü bazı promptlarımı üretmedi ve tuhaf bahanelerle reddetti. Mesela taslak klasörümdeki şu prompt:

“Loş stereo ışığı altında orta yakınlıkta; @ozcanbaris, gözleri parlak ve umut dolu, şakacı bir cesaretle elini uzatır; kadın tereddüt eder, sonra nefes nefese, coşkulu bir gülümsemeyle adım atar.”

Bu prompta “racy material” dedi. Tamam Barbara Cartland’dan etkilenerek bazı promptlar yazmış olabilirim. Ve bunlar gerçekten de ilişkinize bir zarar verebilir. Yani değil mi? Biraz fazla romantik. Biraz fazla melodramatik. 

Yani bir de bunları gizleyemiyorsun. Profilini “Private” yapma seçeneği yok. Herkes seni takip edebiliyor. Alabileceğin tek önlem yaptığın bazı şeyleri “Drafts”ta yani taslak klasöründe bırakmak. Mesela ben şunu tabiki yayınlamadım. Bunlar sen yayınlamayı seçmedikçe görünmüyor. Siz de görmediniz.

Bir başka eksi, dediğim gibi şu anda erişimin çok kısıtlı olması. Kişi başı sadece 4 davetiye veriliyor. Sunucuların çökmesini önlemek için yapıldığını anlıyorum ama uygulamayı denemek isteyen birçok kişi dışarıda kalıyor. Kullanıcı sayısı hâlâ sadece binlerle ifade ediliyor. Bunu da en çok beğeni alan videolardan anlıyoruz, 1000 civarında beğeni alabilyorlar en fazla, trending ortalaması da birkaç yüz beğenide kalıyor.

Videoları kaydettiğinizde üzerine Sora filigranı ekliyor ve bu klipler ayrıca görünmez C2PA metadata içeriyor. Bu olmadan kaydetme seçeneği yok, tıpkı TikTok gibi. Bence bu iyi bir şey, yapay zekayla yapılan tüm üretimlerin açıkça deklare edilmesi şart. Tabi ekran kaydıyla atlatmak kolay ama neyse. Sonuçta Sora’yı bugün kullanmasınız da o sizin önünüze bol bol düşecek, şu filigrandan anlayabilirsiniz.

En sevdiğim anime sanatçılarından büyük usta Hayao Miyazaki, 2016’da yapay zekayla yapılmış bir animasyonu gördüğünde “Bu hayatın kendisine hakaret” demişti. O zamanki dehşeti, başını kullanarak sürünen korkunç bir yaratıktı. Bugün ise Miyazaki’nin kendi tarzı, onun izni olmadan, hatta muhtemelen haberi bile olmadan milyonlarca kez kopyalanıyor Sora 2’de. İroni mi? Trajikomedi mi? Biz yapıp üzerine bir de güldüğümüze göre her ikisi de.

Miyazaki’nin o meşhur “insult to life itself” tepkisine ben de kısmen katılıyorum. Çünkü temel bir kaygı var burada: Sanat, insan ruhunun ifadesi. Studio Ghibli’nin her karesi, binlerce sanatçının elinden çıkmış. Her çizgi, birilerinin emeği, ter dökme süreci. Şimdi biri “Ghibli tarzında bir kedi” yazıyor ve 10 saniyede yazdığı şey ortaya çıkıyor.

Bu sanatın incelttiği insan ruhuna yapılan biraz kabaca bir hareket gibi geliyor. Beni asıl ürküten şey, insanların bu kaba saba, taklidin taklidi diyebileceğimiz üretimlere, onların aslını görmeden önce muhatap olması. Bu bir çeşit beyin nasırlaşmasına yol açabilir diye korkuyorum. O yüzden önce Miyazaki seyredin arkadaşlar.

Beni korkutmaktan çok şaşırtan başka bir şey de Open AI’ın CEO’su Sam Altman’ın kendi cameo’sunun kullanılmasına izin vermesi. Evet, Sam Altman kendi cameo’sunu herkese açık bıraktı. Şu an Sora’da Altman’ın hemen her şeye dönüştürüldüğü videolar dolaşıyor. Eminim burada vermeye çalıştığı bir PR mesajı var: “Bakın, ben korkumuyorum bu teknolojiden, siz de korkmayın” mesajı. İyi de Altman’ın korunacak bir sanatsal mirası yok ki. Onun için bunlar sadece meme materyali, viral pazarlama.

Bu taktikleri de muhtemelen Elon Musk’tan, Mark Zuckerberg’den öğrendi. Onlar da kendilerini meme haline getirmekten çekinmediler, aksine bunu çaktırmadan ve bilinçli bir stratejiyle yaptılar. Deepfake’leriyle dalga geçilmelerini sağladılar. Biri Nazi selamı bile verdi ve sonuçta konuşuldular. Genç nesil onların bazı şeylerini “cool” buldu, daha çok takip etti, bazıları kendine daha yakın hissetti. Sosyal medyadaki bazı influencer – takipçi ilişiklerinde de sezebilirsiniz bu durumu. Küfreden birini daha samimi bulur insanlar, hatta daha çok güvenir. Nazik olduğunuzda, sözlerinizi özenle seçtiğinizde yapmacık damgası yersiniz. Oysa belki gerçek hayatta da böylesinizdir. Neyse işte bence Sam Altman da şu anda böyle bir dönüşüm içerisinde. Sosyal medya üzerinde meme’lerle toplumsal kültürün katalizörü haline gelmek. Konuyu bir de böyle görmek lazım. Birilerini sosyal medya üzerinde tartışırken, kavga ederken görürseniz bili nki kaybeden onlar değil. Kaybolan sizin çok değerli olan zamanınız. Çünkü Elon Musk xAI ile, Mark Zuckerberg Meta AI ile Sam Altman da OpenAI ile kendi güçlerine güç katıyorlar. Üçü de milyarlarca dolar kazanıyor bu işten.

Bu “meme demokrasisi” yanılsaması da bence çok tehlikeli. Çünkü sıradan insanlar da kendilerini meme yapabilme özgürlüğünün arkasına saklanarak, aslında bu dev teknoloji şirketlerinin telif hakkı çalan, sanatçıları mağdur eden sistemlerini bir anlamda meşrulaştırıyorlar. “Ama ben sadece eğlence için yaptım” diyerek.

Open AI önlem olarak isteyen herkes başvuru yapıp sistemden çıkabilir diyor. Yani Opt-out sistemi? Yani saçmalık. Milyonlarca telif hakkı sahibi tek tek OpenAI’ya “benim eserim kullanılmasın” mı demeli? Bu nasıl bir adalet anlayışı?

İşte o yüzden internet’in resmen bittiği an gibi biraz iddialı bir ifade kullandım en başta. Teknolojik gelişmeleri sizlere aktarırken işin diğer boyutlarını da, bizi etkileyecek kısımları da tahmin etmeye çalıştığım için. Çünkü bu internet hayatımıza girdiğinden beri birkaç kez yaşadığımız kültürel bir kırılma noktası. TikTok ve Instagram bizi zaten tüketim zombilerine çevirmişti. Şimdi bir de üretim zombisi olacağız. Hem de kendi kimliğimizle yapacağız bunu. Herkes bir şeyler üretecek belki ama kimse gerçekten bir şey yaratacak mı? Hadi bunu zaten herkes yapamaz diyelim ama en azından kaliteli yaratıcıların, iyi sanatçıların eserleri değersizleşecek mi?

Miyazaki bir arkadaşını düşünerek o tepkiyi vermişti. Engelli bir arkadaşının yaşadığı zorlukları, onun acısını düşünerek. “İnsanlık kendine olan inancını kaybediyor” demişti. 2016’da söylemişti bunu. Şimdi 2025’teyiz ve galiba haklı çıkıyor.

Sizin de o üç sayıyı okuyup kafanızı sallayarak Cameo kaydetmeniz 15 saniye sürüyor. Sonra kendinizi ejderha sırtında, uzayda, film setlerinde görebiliyorsunuz. Eğlenceli mi? Evet. Zararsız mı? Onun cevabını da siz tartışın aşağıda.

Her seferinde biraz daha gerçeklikten uzaklaşıyoruz. İnternet bitti mi gerçekten? Tabiki hayır. Belki sadece bir dönüşüm, bir evrim geçiriyor. Ama bu evrim, Miyazaki’nin korktuğu yöne gitmemeli: İnsanın kendine olan inancını kaybettiği, her şeyin bir promptla halledilebileceğini düşündüğü, telif hakkının, emeğin, sanatın değersizleştiği bir dünyaya.

Sora 2 teknik olarak muhteşem. Ama etik olarak aşırı gri bir alanda. Ve en kötüsü? Biz buna gülüp geçiyoruz. Hatta keyif alıyoruz.

Peki şimdi ne yapacağız?

Sora’yı silip atmayacağız. Yapay zekayı durduramayacağız. Zaten olmamalı da. Her zaman söylediğim gibi teknoloji kötü değil, nasıl kullanıldığı önemli.

Miyazaki’nin eleştirisi o spesifik kullanıma yönelikti ama aynı Miyazaki, kariyeri boyunca teknolojiyi hikaye anlatımı için kullanan biriydi. Araç önemli değil, niyet önemli.

Peki biz ne yapabiliriz?

Farkında olun. Her viral klibin ardında bir bedel var. Bunu bilerek tüketin, bilerek üretin.

Sanatçıları destekleyin. Gerçek insanların yaptığı işlere para verin. Bir yapay zeka 10 saniyede üretebilir ama bir sanatçı bir ömür boyu öğrenir.

Yasal düzenlemeleri isteyin. Opt-out değil, opt-in olmalı. Telif sahipleri izin vermedikçe eserleri kullanılmamalı.

Yapay zekayı bir yardımcı olarak kullanın, ana oyuncu olarak değil. İlham versin, fikir üretsin ama final ürün insan emeği olsun.

Umut verici olan şu: İnsanlar hâlâ gerçek olanı önemsiyor. Konserler doluyor, el yapımı ürünler revaçta. Çünkü ruh arıyoruz. Bağlantı arıyoruz. Yapay zeka bunu veremez.

Miyazaki 82 yaşında hâlâ film yapıyor. Elle çiziyor. Yavaş yavaş, sabırla, sevgiyle. O kadar viral içerik arasında, onun bir karesi binlerce Sora videosundan daha değerli. 

Siz yine de Cameo’nuzu oluşturabilirsiniz. Arkadaşlarınızla eğlenebilirsiniz. Ama unutmayın: Gerçek yaratıcılık hâlâ insanda. Gerçek bağlantı hâlâ insanda. Gerçek sanat hâlâ insanda.

Internet’in eski hali bitti olabilir. Ama belki de yeni bir internet inşa etme zamanı. Daha bilinçli, daha etik, daha insancıl bir internet.

Ve bu, hepimizin elinde.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir