Yapay zeka görsel üretimi artık o kadar yaygın ki sosyal medyada karşılaştığınız her ikinci “etkileyici” fotoğrafın gerçek olup olmadığını sorgulamak zorunda kalıyorsunuz. Ancak “Bu görsel yapay zeka üretimi mi?” sorusunun ötesinde daha ince bir soru var: Hangi model üretmiş?

Bu sorunun cevabı, adli analizde kritik önem taşır. Midjourney ve DALL-E 3, farklı mimari tercihler nedeniyle görsellerine özgün “parmak izleri” bırakır. Bu parmak izlerini tanımayı öğrenmek, hem profesyonel içerik doğrulayıcılar hem de meraklı kullanıcılar için değerli bir beceridir.

Mimari Farklılıklar: Nereden Geliyorlar?

Midjourney

Midjourney, Discord üzerinden erişilen ve bulut tabanlı çalışan tescilli bir difüzyon modelidir. Eğitim veri seti büyük ölçüde sanatsal içerikten oluşur; bu yüzden çıktıları sinematik, empresyonist ve estetik açıdan “yoğun” bir his verir. Model, CLIP tabanlı metin gömme tekniklerini difüzyon süreciyle birleştirir ve özellikle v5/v6 sürümlerinde yüksek frekans detaylarını kasıtlı olarak yumuşatır.

DALL-E 3

OpenAI’nin DALL-E 3’ü ise farklı bir yol izler: Metin anlama için GPT-4 kullanır, görüntü üretimi için ise özel bir difüzyon ağından yararlanır. Model, ChatGPT ekosistemiyle entegre çalışacak şekilde optimize edilmiştir ve çıktıları daha “fotogerçekçi” olmaya eğilimlidir. DALL-E 3, C2PA (Coalition for Content Provenance and Authenticity) standardını destekleyen ilk büyük modellerden biridir.

Görsel Özellikleri: Yan Yana Karşılaştırma

ÖzellikMidjourney v6DALL-E 3
Genel hisSinematik, sanatsalFotogerçekçi, steril
Kenar işlemeYumuşak, blend edilmişKeskin, bazen fazla keskin
Doku tutarlılığıYüksek, ama tekrarlayanOrta, alan bazlı değişken
Işık/gölgeDramatik, homojenDoğal ama zaman zaman tutarsız
Arka planÇoğunlukla tutarlıPerspektif hataları sık
İnsan parmaklarıv5’te hatalı, v6’da iyileşmişHâlâ zaman zaman sorunlu
Yazı/metinBüyük ölçüde başarısızKısmen başarılı (DALL-E 3 HD)
YansımalarEstetik ama fiziksel açıdan hatalıDaha tutarlı ama seyrek yanlış

ELA Analizi: Hata Seviyeleri Neyi Söylüyor?

Error Level Analysis (ELA), bir görselin farklı bölgelerinin sıkıştırma baskısına nasıl tepki verdiğini ölçer. Gerçek fotoğraflarda ELA haritası genellikle tutarsız bir dağılım gösterir: kenarlar parlak, düz yüzeyler karanlık.

Midjourney ELA Özellikleri

Midjourney görselleri ELA’da karakteristik bir örüntü sergilemektedir:

  • “Grid pattern” (ızgara deseni): Modelin dikkat mekanizmasından kaynaklanan, 8x8 veya 16x16 piksellik blok sınırlarında belirgin ELA sıçramaları
  • Homojen orta bölgeler: Dokuların işlendiği alanlarda ELA değerleri beklenmedik biçimde düşük kalır
  • Kenar aşırı yükü: Sanatsal keskinlik filtreleri nedeniyle nesne sınırlarında anormal ELA yüksekliği

DALL-E 3 ELA Özellikleri

DALL-E 3’ün ELA haritası farklı bir hikaye anlatır:

  • Bölgesel tutarsızlık: Aynı yüzeyin farklı bölgelerinde dramatik ELA farkları — gerçek fotoğraflarda bu kadar keskin geçişler nadirdir
  • Metin bölgesi anomalileri: Model metni oluşturmaya çalıştığında o bölgede ELA değerleri patlar
  • Nesne birleşim noktaları: İki nesnenin buluştuğu yerlerde yapay yumuşatma belirgindir

FFT Analizi: Frekans Alanında İzler

Fast Fourier Transform (FFT) analizi, görselin frekans bileşenlerini inceler. Gerçek bir kamera lensi, optik özellikleri nedeniyle görsel frekans spektrumuna özgün bir imza bırakır.

Midjourney görsellerinde FFT spektrumu halka benzeri düzenli yapılar gösterir — bu, difüzyon modelinin noise scheduler’ından kaynaklanan bir örüntüdür. DALL-E 3’te ise spektrum daha gürültülü ve düzensizdir, ancak yüksek frekanslarda ani düşüşler tipiktir. Her iki model de gerçek kamera görsellerinin sahip olduğu kısmi tutarlı frekans dağılımından yoksundur.

EXIF ve Metadata: Kritik Sessizlik

Gerçek bir dijital kamerayla çekilen fotoğraflar zengin metadata içerir: kamera modeli, objektif tipi, çekim tarihi, GPS koordinatları, ISO, deklanşör hızı…

Midjourney çıktıları ya boş EXIF içerir ya da Discord’un yükleme sürecinin eklediği minimal bilgilerle gelir. Modelin kendine özgü bir metadata imzası yoktur.

DALL-E 3 ise farklı bir yaklaşım benimser. API üzerinden üretilen görseller, Image Generator yazılım etiketiyle işaretlenmiş EXIF verileri içerebilir. Bu, modelin “ben buradayım” demesinin bir yoludur — ancak bu etiket kolayca silinebilir.

C2PA: Önemli Bir Ayrışma Noktası

C2PA (Coalition for Content Provenance and Authenticity) standardı, görselin yaşam döngüsünü kriptografik olarak kayıt altına almayı amaçlar. Bir görsel oluşturulduğunda, düzenlendiğinde veya yayınlandığında bu olaylar görünmez bir zincire eklenir.

ÖzellikMidjourneyDALL-E 3
C2PA desteğiHayırEvet (ChatGPT/API)
Üretici imzasıYokOpenAI sertifikası
Kaldırılabilir mi?Evet, metadata sıyrıldığında
GüvenilirlikDüşük (yoksa şüpheli)Orta (varsa kesin, yoksa belirsiz)

Önemli bir not: C2PA içeriğinin yokluğu görselin yapay zeka üretimi olmadığını kanıtlamaz. Midjourney zaten bu standardı uygulamıyor; dahası herhangi bir araç metadata’yı kolayca silebilir. Ancak DALL-E 3 C2PA içeriği varsa, bu güçlü bir kanıttır.

Hangi Model Daha Zor Tespit Edilir?

Bu soru, hem teknik hem de bağlamsal bir değerlendirme gerektirir.

Midjourney v6, fotogerçekçilik yerine estetik kaliteyi önceliklendirdiği için tespit aslında daha kolay olabilir — çünkü sanatsal mükemmellik kendi başına bir uyarı işaretidir. Ancak v6 ile üretilen portreler, özellikle doğal ışıkta, deneyimsiz bir göze gerçekçi görünebilir.

DALL-E 3, fotogerçekçilik odağıyla daha zorlu bir hedef sunar. Özellikle “iPhone ile çekilmiş” tarzı istemlerle üretilen görseller, ELA ve FFT analizleri olmadan fark edilmesi güç sahte görseller ortaya çıkarabilir.

Her iki model için de bağlam analizi hayati önem taşır: Görselin iddia ettiği kaynak, çekim tarihi ve koşullarıyla tutarlı mı? Metadata ne söylüyor? Bu soruları otomatik olarak yanıtlamak, çok katmanlı analiz araçları gerektirir.

FakeRadar ile Analiz Edin

Bir görselin Midjourney mi, DALL-E mi yoksa başka bir model tarafından mı üretildiğini merak ediyorsanız, FakeRadar’ın ücretsiz analiz aracını kullanabilirsiniz. Pro planla ELA haritası, FFT spektrumu, C2PA doğrulaması ve tam EXIF analizi tek bir raporda sunulur.

Daha fazla adli analiz tekniği için blog yazılarımıza göz atın.