Yapay zeka görsel üretimi artık o kadar yaygın ki sosyal medyada karşılaştığınız her ikinci “etkileyici” fotoğrafın gerçek olup olmadığını sorgulamak zorunda kalıyorsunuz. Ancak “Bu görsel yapay zeka üretimi mi?” sorusunun ötesinde daha ince bir soru var: Hangi model üretmiş?

Bu sorunun cevabı, adli analizde kritik önem taşır. Midjourney ve DALL-E 3, farklı mimari tercihler nedeniyle görsellerine özgün “parmak izleri” bırakır. Bu parmak izlerini tanımayı öğrenmek, hem profesyonel içerik doğrulayıcılar hem de meraklı kullanıcılar için değerli bir beceridir.

Mimari Farklılıklar: Nereden Geliyorlar?

Midjourney

Midjourney, Discord üzerinden erişilen ve bulut tabanlı çalışan tescilli bir difüzyon modelidir. Eğitim veri seti büyük ölçüde sanatsal içerikten oluşur; bu yüzden çıktıları sinematik, empresyonist ve estetik açıdan “yoğun” bir his verir. Model, CLIP tabanlı metin gömme tekniklerini difüzyon süreciyle birleştirir ve özellikle v5/v6 sürümlerinde yüksek frekans detaylarını kasıtlı olarak yumuşatır.

DALL-E 3

OpenAI’nin DALL-E 3’ü ise farklı bir yol izler: Metin anlama için GPT-4 kullanır, görüntü üretimi için ise özel bir difüzyon ağından yararlanır. Model, ChatGPT ekosistemiyle entegre çalışacak şekilde optimize edilmiştir ve çıktıları daha “fotogerçekçi” olmaya eğilimlidir. DALL-E 3, C2PA (Coalition for Content Provenance and Authenticity) standardını destekleyen ilk büyük modellerden biridir.

Görsel Özellikleri: Yan Yana Karşılaştırma

Özellik	Midjourney v6	DALL-E 3
Genel his	Sinematik, sanatsal	Fotogerçekçi, steril
Kenar işleme	Yumuşak, blend edilmiş	Keskin, bazen fazla keskin
Doku tutarlılığı	Yüksek, ama tekrarlayan	Orta, alan bazlı değişken
Işık/gölge	Dramatik, homojen	Doğal ama zaman zaman tutarsız
Arka plan	Çoğunlukla tutarlı	Perspektif hataları sık
İnsan parmakları	v5’te hatalı, v6’da iyileşmiş	Hâlâ zaman zaman sorunlu
Yazı/metin	Büyük ölçüde başarısız	Kısmen başarılı (DALL-E 3 HD)
Yansımalar	Estetik ama fiziksel açıdan hatalı	Daha tutarlı ama seyrek yanlış

ELA Analizi: Hata Seviyeleri Neyi Söylüyor?

Error Level Analysis (ELA), bir görselin farklı bölgelerinin sıkıştırma baskısına nasıl tepki verdiğini ölçer. Gerçek fotoğraflarda ELA haritası genellikle tutarsız bir dağılım gösterir: kenarlar parlak, düz yüzeyler karanlık.

Midjourney ELA Özellikleri

Midjourney görselleri ELA’da karakteristik bir örüntü sergilemektedir:

“Grid pattern” (ızgara deseni): Modelin dikkat mekanizmasından kaynaklanan, 8x8 veya 16x16 piksellik blok sınırlarında belirgin ELA sıçramaları
Homojen orta bölgeler: Dokuların işlendiği alanlarda ELA değerleri beklenmedik biçimde düşük kalır
Kenar aşırı yükü: Sanatsal keskinlik filtreleri nedeniyle nesne sınırlarında anormal ELA yüksekliği

DALL-E 3 ELA Özellikleri

DALL-E 3’ün ELA haritası farklı bir hikaye anlatır:

Bölgesel tutarsızlık: Aynı yüzeyin farklı bölgelerinde dramatik ELA farkları — gerçek fotoğraflarda bu kadar keskin geçişler nadirdir
Metin bölgesi anomalileri: Model metni oluşturmaya çalıştığında o bölgede ELA değerleri patlar
Nesne birleşim noktaları: İki nesnenin buluştuğu yerlerde yapay yumuşatma belirgindir

FFT Analizi: Frekans Alanında İzler

Fast Fourier Transform (FFT) analizi, görselin frekans bileşenlerini inceler. Gerçek bir kamera lensi, optik özellikleri nedeniyle görsel frekans spektrumuna özgün bir imza bırakır.

Midjourney görsellerinde FFT spektrumu halka benzeri düzenli yapılar gösterir — bu, difüzyon modelinin noise scheduler’ından kaynaklanan bir örüntüdür. DALL-E 3’te ise spektrum daha gürültülü ve düzensizdir, ancak yüksek frekanslarda ani düşüşler tipiktir. Her iki model de gerçek kamera görsellerinin sahip olduğu kısmi tutarlı frekans dağılımından yoksundur.

EXIF ve Metadata: Kritik Sessizlik

Gerçek bir dijital kamerayla çekilen fotoğraflar zengin metadata içerir: kamera modeli, objektif tipi, çekim tarihi, GPS koordinatları, ISO, deklanşör hızı…

Midjourney çıktıları ya boş EXIF içerir ya da Discord’un yükleme sürecinin eklediği minimal bilgilerle gelir. Modelin kendine özgü bir metadata imzası yoktur.

DALL-E 3 ise farklı bir yaklaşım benimser. API üzerinden üretilen görseller, Image Generator yazılım etiketiyle işaretlenmiş EXIF verileri içerebilir. Bu, modelin “ben buradayım” demesinin bir yoludur — ancak bu etiket kolayca silinebilir.

C2PA: Önemli Bir Ayrışma Noktası

C2PA (Coalition for Content Provenance and Authenticity) standardı, görselin yaşam döngüsünü kriptografik olarak kayıt altına almayı amaçlar. Bir görsel oluşturulduğunda, düzenlendiğinde veya yayınlandığında bu olaylar görünmez bir zincire eklenir.

Özellik	Midjourney	DALL-E 3
C2PA desteği	Hayır	Evet (ChatGPT/API)
Üretici imzası	Yok	OpenAI sertifikası
Kaldırılabilir mi?	—	Evet, metadata sıyrıldığında
Güvenilirlik	Düşük (yoksa şüpheli)	Orta (varsa kesin, yoksa belirsiz)

Önemli bir not: C2PA içeriğinin yokluğu görselin yapay zeka üretimi olmadığını kanıtlamaz. Midjourney zaten bu standardı uygulamıyor; dahası herhangi bir araç metadata’yı kolayca silebilir. Ancak DALL-E 3 C2PA içeriği varsa, bu güçlü bir kanıttır.

Hangi Model Daha Zor Tespit Edilir?

Bu soru, hem teknik hem de bağlamsal bir değerlendirme gerektirir.

Midjourney v6, fotogerçekçilik yerine estetik kaliteyi önceliklendirdiği için tespit aslında daha kolay olabilir — çünkü sanatsal mükemmellik kendi başına bir uyarı işaretidir. Ancak v6 ile üretilen portreler, özellikle doğal ışıkta, deneyimsiz bir göze gerçekçi görünebilir.

DALL-E 3, fotogerçekçilik odağıyla daha zorlu bir hedef sunar. Özellikle “iPhone ile çekilmiş” tarzı istemlerle üretilen görseller, ELA ve FFT analizleri olmadan fark edilmesi güç sahte görseller ortaya çıkarabilir.

Her iki model için de bağlam analizi hayati önem taşır: Görselin iddia ettiği kaynak, çekim tarihi ve koşullarıyla tutarlı mı? Metadata ne söylüyor? Bu soruları otomatik olarak yanıtlamak, çok katmanlı analiz araçları gerektirir.

FakeRadar ile Analiz Edin

Bir görselin Midjourney mi, DALL-E mi yoksa başka bir model tarafından mı üretildiğini merak ediyorsanız, FakeRadar’ın ücretsiz analiz aracını kullanabilirsiniz. Pro planla ELA haritası, FFT spektrumu, C2PA doğrulaması ve tam EXIF analizi tek bir raporda sunulur.

Daha fazla adli analiz tekniği için blog yazılarımıza göz atın.

Midjourney ve DALL-E: Yapay Zeka Görsellerini Artefaktlarından Ayırt Etmek

Mimari Farklılıklar: Nereden Geliyorlar?

Midjourney

DALL-E 3

Görsel Özellikleri: Yan Yana Karşılaştırma

ELA Analizi: Hata Seviyeleri Neyi Söylüyor?

Midjourney ELA Özellikleri

DALL-E 3 ELA Özellikleri

FFT Analizi: Frekans Alanında İzler

EXIF ve Metadata: Kritik Sessizlik

C2PA: Önemli Bir Ayrışma Noktası

Hangi Model Daha Zor Tespit Edilir?

FakeRadar ile Analiz Edin

Bir görsel veya videoyu ücretsiz analiz et

Mimari Farklılıklar: Nereden Geliyorlar?

Midjourney

DALL-E 3

Görsel Özellikleri: Yan Yana Karşılaştırma

ELA Analizi: Hata Seviyeleri Neyi Söylüyor?

Midjourney ELA Özellikleri

DALL-E 3 ELA Özellikleri

FFT Analizi: Frekans Alanında İzler

EXIF ve Metadata: Kritik Sessizlik

C2PA: Önemli Bir Ayrışma Noktası

Hangi Model Daha Zor Tespit Edilir?

FakeRadar ile Analiz Edin

Bir görsel veya videoyu ücretsiz analiz et

Okumaya devam et

Midjourney Görselleri Nasıl Tespit Edilir: Adli İzler ve Tespit Araçları

Bu Fotoğraf Yapay Zeka mı? Ücretsiz Adım Adım Kontrol

WhatsApp'tan Gelen Şüpheli Fotoğraf Nasıl Kontrol Edilir