20 Haziran 2025, Cuma
spot_img

YÜKSELEN YAPAY ZEKALAR – DALL-E VE ÖZELLİKLERİ

Yapay zekâ alanında son yıllarda kaydedilen en dikkat çekici gelişmelerden biri, metin girdilerine dayalı görsel üretim sistemleridir. Bu alandaki öncülerden biri olan DALL·E, OpenAI tarafından ilk kez Ocak 2021’de tanıtıldı. İsmini ünlü sürrealist sanatçı Salvador Dalí ve animasyon filmi karakteri WALL·E’den alan bu model, hem sanatı hem de teknolojiyi bir araya getiren yenilikçi yaklaşımıyla kısa sürede ilgi topladı. İlk versiyonu, GPT-3’ün dil anlama yeteneklerini görsel üretimle birleştirerek dikkat çekerken, 2022’de tanıtılan DALL·E 2, daha gerçekçi ve yüksek çözünürlüklü görseller üretmesiyle büyük bir sıçrama yaptı. 2023’te ChatGPT ile entegre edilen sürümü sayesinde, kullanıcılar metinle görsel üretimi çok daha kolay ve etkileşimli bir şekilde deneyimlemeye başladılar. Bu gelişmeler, DALL·E’nin yalnızca bir sanat aracı değil, aynı zamanda yaratıcı düşünceyi destekleyen bir yapay zekâ platformu olarak da konumlanmasına zemin hazırladı. Yapay zekalar ve özelliklerini incelediğimiz serinin bu yazısında, DALL-E’yi ele alacağız.

  • Metinden Görsel Üretme: DALL-E kullanıcıdan aldığı metin komutunu veya betimlemeyi analiz eder ve bu komuta uygun bir görsel üretir. Bu özelliğin bir gerçeklik sınırı bulunmamaktadır. Bu sebeple de, gerçek dışı ve insan aklına bile karmaşık gelen görseller türetilebilir.
  • Görsel Düzenleme: Belirtilen yapay zekanın bu özelliğiyle birlikte insanlar görseller üzerinde istediği düzenlemeleri yapabilirler. Dahası, DALL-E platformuna yüklenen bir fotoğrafın belirli bölümleri silinip yerine farklı bir bölüm eklenebilir. Yine bu özelliğin de bir gerçeklik sınırı yoktur. Yaratıcı tasarımlar üretmek için oldukça etkilidir.
  • Görsel Genişletme: Bir önceki özelliğin daha gelişmiş bir versiyonu olarak karşımıza çıkan bu özellikte ise DALL-E bir görseli dışa doğru genişletebilir. Bu özellik Görsel Düzenleme özelliğine benzer şekilde yaratıcı tasarım seviyesini üst kademeye taşıyabilir. Görsel Genişletme en çok tablo tasarımlarının güçlendirilmesinde ve portre gibi yalnızca yüz gözüken fotoğrafların tamamlanması gibi bağlamlarda kullanılmaktadır.
  • Görsel Varyasyonlar Üretme: DALL-E, komuta bağlı bir görsel oluştururken, bu görsellere alternatif olabilecek görseller de üretmektedir. Bu alternatifler genellikle çok küçük ayrıntıları farklı çizilerek hazırlanır. Böylece, kullanıcı tekrar tekrar komut yazmaktan ve zamandan tasarruf edebilir. Ayrıca bu, yaratıcı süreçte fikir seçme veya prototip çeşitlendirme gibi aşamalarda da önemlidir.
  • Kompozisyon Duyarlılığı: Komut içerisinde özellikle ve özenle belirtilirse DALL-E, görselin kompozisyon duyarlılığını önemli ölçüde arttırabilir. Görselin simetrisi, odak noktası, denge ve perspektifi gibi terimlere daha fazla ölçüde önem vererek görselin estetik görünüşünü güzelleştirebilir. (Kompozisyon Duyarlılığı komutta belirtilmese de belli bir ölçüde uygulanır, fakat daha iyi sonuç almak için komutta belirtmek gerekir.)
  • Yazı ve Tipografi Kullanımı: Özellikle son sürümde (DALL-E 3) görsele yazı ekleme bir özellik olarak varsayılabilir. Fakat bu özelliğin bir dezavantajı bulunmaktadır: Yapay zeka için görsel olarak yazı yazmak hala zordur. Örnek olarak bir çarşı görseli üretmeye çalışırken bir tabelada “Café” yazmasını istediniz. Bu örnekte DALL-E, bir çarşı ortamını gerçekçi bir şekilde çizebilir fakat “Café” yazısını biraz kötü veya şekilsiz yazabilir.

Tüm bu özellikler değerlendirildiğinde, DALL·E yalnızca bir görsel üretim aracı olmanın ötesine geçerek, kullanıcıların hayal gücünü somutlaştırmalarına olanak tanıyan güçlü bir platform olarak karşımıza çıkıyor. Gerçeküstü sahneleri bile mantıklı bir şekilde yorumlayabilmesi, düzenleme ve genişletme yetenekleriyle yaratıcı süreçlere esneklik kazandırması, onu çağdaş yapay zekâ sistemleri arasında özel bir yere konumlandırıyor. Elbette teknolojinin hâlâ aşması gereken bazı sınırlar mevcut; ancak geldiği nokta, gelecekte ne denli etkileyici boyutlara ulaşabileceğinin güçlü bir göstergesi. DALL·E, sanat ile teknolojiyi birleştiren bu yolculukta, hem üretici hem de ilham verici bir yapay zekâ olarak dikkat çekiyor.

Aşağıda ODTÜ Devrim Stadyumu’nun DALL-E tarafından çizilmiş bir versiyonu bulunmakta. İnsan, ağaç, stadyum gibi öğeler gerçekçi çizilmiş fakat ODTÜ Devrim Stadyumuna pek benzememekte. Sizin de DALL-E’nin bu çizimi hakkındaki görüşlerinizi yorumlar kısmına yazmanızı rica ediyoruz.

İlgili Yazılar

spot_img

Son Yazılar