DALL-E Yapay Zekası Nedir? Çizim Yapabilen Yapay Zeka!

DALL-E Sadece yazı, makale, hikaye değil, şiir bile yazabilen bir GPT-3 vardı… Bazı metinleri öylesine ustalıkla yazıyordu ki bize bunların bir insan tarafından yazılmadığı söylendiğinde inanmakta güçlük çekiyorduk. İşte onu geliştiren Open AI bu kez de resim yapabilen başka bir dil modeli geliştirdi. Sadece resim de değil, tasarım yapabilen, çizimler, taslaklar oluşturabilen, hatta hiç çekilmemiş fotoğraflar üretebilen yepyeni bir yapay zeka modeli DALL-E’dir.
Open AI tanımına göre, “Doğal dilde ifade edilebilen çok çeşitli kavramlar için metin başlıklarından görüntüler oluşturan DALL-E adlı bir sinir ağını eğittik.” DALL-E servisi temelinde yazılı açıklamalarından görüntü oluşturmak için eğitilmiş GPT-3. DALL-E ismi ise paylaşılan bilgilere göre ünlü sanatçı Salvador Dalí and Pixar’ın en sevilen karakterlerinden olan WALL-E‘nin birleşmesi ile oluşturulmuş.

OpenAI DALL·E: Fighter Jet For The Mind! ✈️ - YouTube

Open Al Nedir?

Kendini “kar amacı gütmeyen yapay zeka araştırma şirketi” olarak tanımlayan Open AI 2015 yılında kuruldu. Çalışmaları arasında birçok kişinin işine yarayacak ‘ev işlerine yardımcı olacak robotlar üretmek’ de var. Ayrıca kurucuları arasında Elon Musk ve Y Combinator Başkanı Sam Altman gibi önemli isimler bulunan ve 2019 yılının Temmuz ayında Microsoft’tan 1 milyar dolar yatırım alan OpenAI, geçtiğimiz günlerde yepyeni bir servis ile karşımıza çıktı. Open AI tarafından geliştirilen DALL-E servisi, yapay zeka desteği sayesinde yazılı tanımlar üzerinden görseller yaratabiliyor. Oldukça basit bir çalışma şekline sahip olan DALL-E servisini kullanmak için tek yapmanız gereken nasıl bir görsel elde etmek istediğiniz ile ilgili bir yazılı tanım hazırlamak.

Yapay Zeka Dall-E Nedir?

DALL-E metin-görüntü parametrelerini kullanarak yazılan cümlelerden görseller oluşturmak üzere yapay zeka öğrenmesi kullanan GPT-3’ün 12 milyar parametreli bir sürümüdür.
Örneğin yapay zeka DALL-E’ye “Turunculu ve siyahlı oduncu gömleği giydirilmiş bir erkek manken” şeklinde yazdığınızda size turunculu ve siyahlı oduncu gömleği giymiş erkek manken örnekleri oluşturabiliyor. Daha fazla örnek aşağıda vardır.

dall-e turuncu ve siyah oduncu gömlek — “DALL-E ayrıca bazen daha az yaygın renkleri diğer komşu tonlarla karıştırıyor gibi görünüyor. Örneğin, “lacivert” olarak kıyafet çizmesi istendiğinde, DALL-E bazen daha açık mavi tonları veya siyaha çok yakın tonlar kullanır. Benzer şekilde, DALL-E bazen “zeytin” yi kahverenginin tonları veya daha parlak yeşil tonları ile karıştırır.”

Yapay zekanın yapabildiği bununla da sınırlı değil. Örneğin DALL-E’ den “Gün doğumunda tarlada oturan bir Kapibara” görüntüsü istediğimizde sahneyi parklı açılardan çizip, ışığı, gölgeleri ve ortamı günün farklı saatlerine göre çizebiliyor.

“DALL-E’nin aynı sahneyi çeşitli farklı stillerde oluşturabildiğini ve ışığı, gölgeleri ve ortamı günün saatine veya mevsime göre uyarlayabildiğini gördük.”

“Şekli avokadoya benzeyen koltuk” veya “beşgen şeklinde yeşil bir saat” gibi ifadelerden yüzlerce farklı resim üretebilen DALL-E, aynı zamanda cümle içerisindeki pozisyon bilgilerini, malzemeleri, nesneler arası ilişkileri ve nesnelerin kendileriyle ilgili özelliklerini diğerleriyle karıştırmadan anlayıp, uygun bir şekilde işleyebiliyor.

DALL-E’nin Görselleştirdiği Avokado Resimleri

DALL-E’nin bazen San Francisco’daki belirli konumların görünüşlerini oluşturabildiğini görüyoruz. Yazarların aşina olduğu San Francisco gibi yerler için, bize var olmayan çok özel yerleri hatırlatan sokakların, kaldırımların ve kafelerin ürkütücü bir benzetimi olan dejavu duygusu uyandırıyorlar.

DALL-E’nin Görselleştirdiği Alamo Resimleri

Kamera açısı, doku, yansıma gibi özellikler konusunda da beklenenden çok daha iyi performans sergileyen modelin, nesnelerin iç özelliklerine (örneğin bir cevizin içi) ve bulunduğu bağlamların bilgisine de oldukça hakim olduğu görüldü.

DALL-E’nin Görselleştirdiği Salyangoz Resimleri

Peki Grafik Tasarımcıların Mesleğini Elden Gider mi?

Iletişim, Çalışma Alanı, Imac, Masaüstü, Yaratıcı

Daha ilerlemesi gereken çok yol var ki hayatımız boyunca zaten teknolojinin gelişmesiyle birçok mesleklerde farklı şekillerde şekillendi. Nasıl daha önce bilgisayar üzerinden grafik tasarım yapılmıyorsa, bu nasıl teknolojiye ayak uydurduysa ya da helikopterden kamerayla çekim yapan kişilerin yerine dronelerin gelmesiyle drone kullanmakta bir meslek haline geldiyse, bu da o şekilde şekillenecektir. Böyle bir yapay zeka teknolojisi pat diye çıkacak ve Grafik Tasarımcıların mesleği yok olacak diye düşünmeyin. Bunu kendi yararınıza kullanabilirsiniz. Ama 10 sene içinde veya sonrasında ne olur onu da bilemeyiz.

DALL-E ile Bunlarla Sınırlı mı?

Birbiriyle alakasız nesneleri insana benzer şekilde ilişkilendirebildiği keşfedilen DALL-E, aynı zamanda nesnelerle alakalı yalnızca onların görüntüleriyle veya yapılarıyla sınırlı kalmayıp, coğrafi ve zamansal bilgileri de bünyesinde tutuyor. Elbette bazıları saçma olabilir ama en azından tasarımcılar için çok hızlı bir şekilde beyin fırtınası yapabilmek, olasılıkları görebilmek adına bile son derece güçlü bir araç bu.

DALL-E’nin üreteceği görseller tamamen sizin tanımlamalarınıza, fikirlerinize kalmış durumda. DALL-E’den yeşil gözlü bir kedi görseli de isteyebilirsiniz, avokado şeklinde bir koltuk da. Yapay zeka üzerinden görsel üretmek özellikle sık sık görsele ihtiyaç duyan insanların işlerini olukça kolaylaştıracaktır. Bu teknolojinin gelişmesi ile birlikte stok fotoğrafçılığı büyük bir darbe alabilir. Bu bakış açısıyla robot Wall-e ve sanatçı Dali’nin birleşiminden oluşan DALL-E adlı bu yeni yapay zeka modelini daha çok resim çizmeye çalışan çocuklara benzetebiliriz. Eline yeni kalem almış ve gördüklerini çocuksu bir şekilde kağıda çizmeye çalışıyor henüz. Bebeklere, çocuklara ne verirseniz, neyi görürlerse onu taklit etmeye çalışırlar ya. İşte DALL-E’de öyle.

Beni en çok bu kabiliyeti etkiledi. Peki Neden? Wall-e gibi karakterleri tasarlayan ve bunlardan filmler üreten Pixar gibi animasyon stüdyoları işe alım yaparken başvuranları özel bir testten geçirir. Onların yeteneklerini ölçebilmek için uygulanan bu teste “çuval testi” denir. Eğer bir un çuvalına hayat verebilirseniz yeteneklisiniz demektir. Cansız bir nesneye insan özellikleri katabilmek çok önemli bir yetenek göstergesidir. Animasyonun özüdür, çünkü animasyon canlandırma demektir. Cansız bir şeye can katma. O yüzden Pixar filmleri hep o masa lambasıyla başlar. Çocuk gibi sevinçle zıplayan bir masa lambası yapıp sizi heyecanlandırabiliyorsak her şeyi yapabiliriz demektir bir anlamda bu. Sanırım önümüzdeki yıllarda artık böyle şeyler görmeye hazırlanmamız gerekiyor. Galiba 2025’te gerçekten de…

DALL-E, GPT-3 ve yapay zeka desteği sayesinde sıfırdan biri görsel oluşturmaktan tutun da varolan bir görselin belli noktalarında tanımlara uyan değişiklikler yapmaya kadar pek çok yeteneğe de sahip durumda. DALL-E ile oluşturulan görsel örneklerine buradan ulaşabilirsiniz.

Dall-E Nasıl Kullanılır?

DALL-E internet sitesi üzerinden belli kalıplar denenebiliyor.
Henüz tam kullanıma açık olmayan DALL-E’nin gelecekte insanların hayatını nasıl etkileyeceğini hep birlikte göreceğiz. DALL-E’nin üreteceği görseller tamamen sizin cümlelerinize kalmış durumda. Sanırım önümüzdeki yıllarda artık böyle şeyler görmeye hazırlanmamız gerekiyor. Galiba 2025’te gerçekten de… Yapay zeka üzerinden görsel üretmek özellikle sık sık görsele ihtiyaç duyan insanların işlerini olukça kolaylaştıracaktır.

Sitemizde daha fazla teknoloji haberleri var. Göz atmayı unutmayın.

Siz bu teknoloji hakkında ne düşünüyorsunuz? Bizlere yorumlarda belirtmeyi unutmayın.

DALL-E Yapay Zekası Nedir? Çizim Yapabilen Yapay Zeka!