Midjourney, piyasadaki en fotorealistik yapay zeka görsel üretecilerinden biridir. V6 ve sonraki versiyonlar artık birçok insan için gerçek fotoğraftan ayırt edilemez kalitede çıktılar üretmektedir. Bu durum; gazetecilik, hukuk, dijital güvenlik ve sosyal medya doğrulama alanlarında ciddi bir sorun haline gelmiştir. Bu yazıda Midjourney’nin teknik altyapısını, çıktılarına özgü görsel ve adli izleri ve bu görselleri nasıl tespit edebileceğinizi ele alıyoruz.

Midjourney’nin Teknik Altyapısı

Midjourney, diffusion modeli mimarisine dayanır. Eğitim verisi olarak internetten derlenen milyarlarca görsel kullanılmış; bu veri kümesi üzerinde yinelenen gürültü giderme (denoising) adımlarıyla model, metin açıklamalarından yüksek kaliteli görsel üretmeyi öğrenmiştir.

Midjourney’yi diğer diffusion modellerinden (Stable Diffusion, DALL-E 3) ayıran birkaç özellik vardır:

  • Özel estetik yönelim: Model yalnızca fotogerçekçilik değil, “sinematik” ve “sanatsal” kaliteye doğru yönlendirilmiştir
  • Kapalı kaynak: Midjourney’nin model ağırlıkları ve eğitim süreci kamuya açık değildir; bu durum bazı adli analiz tekniklerini sınırlar
  • Discord entegrasyonu: Çıktılar Discord üzerinden üretilir, bu da meta veri takip zincirini karmaşıklaştırır
  • Yüksek çözünürlük upscaling: Model kendi upscaler’ını kullanır; bu özel artefakt örüntüleri bırakır

Midjourney Görsellerine Özgü Görsel Özellikler

Midjourney çıktıları insan gözüyle de tanınabilir belirli estetik özellikler taşır. Ancak bu özellikler versiyondan versiyona değişmektedir.

”Dreamlike” Kalite

Midjourney görselleri genellikle gerçek dünyadan biraz fazla kusursuz görünür. Işıklar mükemmel dağılmış, renkler zenginleştirilmiş, yüzeyler aşırı pürüzsüzdür. Bu “filmik” kalite ince ama tutarlı bir işarettir. Gerçek fotoğrafların rastlantısal kusurları, kötü ışık, hafif bulanıklık yoktur; her şey sanki profesyonel bir set tasarımından çıkmış gibidir.

El ve Parmak Artefaktları

Bu, Midjourney’nin en bilinen zayıf noktasıdır. Model eller ve parmaklar konusunda tutarsız davranır:

  • Fazladan parmak (6, 7 veya daha fazla)
  • Eksik parmak ya da anormal kısalık/uzunluk
  • El anatomisinin bozulması: avuç içi orantısız büyük, bilek yok
  • Parmak eklemlerinde belirsizleşme veya erime

V6 ile bu sorun önemli ölçüde azalmıştır, ancak karmaşık el pozisyonlarında hâlâ gözlemlenmektedir.

Metin ve Yazı Hataları

Midjourney görsellerdeki yazıyı anlayarak değil, görsel bir desen olarak üretir. Sonuçta:

  • Tabelalar ve levhalar anlamsız karakterler içerir
  • Harfler gerçekçi görünür ama okunaksızdır (“sahte alfabe”)
  • Uzun metin dizileri ortasında bozulur
  • Arap harfleri, Kiril alfabesi gibi yazı sistemleri özellikle hatalı üretilir

Bir görselde metin varsa ve anlamsız görünüyorsa bu güçlü bir işarettir.

Simetri Desenleri ve Tekrarlayan Elementler

Midjourney simetri eğilimlidir; doğal sahnelerde olmayan dengeli kompozisyonlar üretir. Arka planda tekrarlayan nesneler (ağaçlar, pencereler, insanlar) gerçekçi olmayan bir düzene sahip olabilir. İki kişi varsa yüzleri birbirine fazla benzer olabilir; model zaman zaman aynı yüzü küçük farklarla kopyalar.

Aşırı Keskinleştirilmiş Kenarlar ve Yapay Bokeh

Midjourney’nin upscaler’ı kenarlarda aşırı keskinleştirme uygular. Saç teli, kumaş lifi veya yaprak kenarları gerçek bir fotoğrafa kıyasla anormal derecede keskin ve “çizilmiş” görünür. Öte yandan arka plan bulanıklığı (bokeh) gereğinden fazla dramatik ve yapay pürüzsüzdür; gerçek lens bokeh’inin optik tutarsızlıklarını taşımaz.

Adli Analiz: ELA ve FFT’deki İzler

ELA (Error Level Analysis)

ELA, JPEG sıkıştırma tutarsızlıklarını görselleştirir. Gerçek bir fotoğrafta farklı bölgeler (zemin, yüzey, arka plan) farklı sıkıştırma geçmişleri taşır. Midjourney görsellerinde ELA haritası genellikle şu özellikleri gösterir:

  • Tekdüze ELA katmanları: Tüm görsel aynı sıkıştırma seviyesinden çıkmış gibi görünür; parçalar arası geçiş izleri yoktur
  • Kenar bölgelerinde yoğunlaşma: Upscaler’ın uyguladığı keskinleştirme işlemi ELA’da kenarlarda belirgin düzensizlik bırakır
  • Yüz/deri bölgelerinde düzlük: Gerçek cilt dokusunun yarattığı ELA örüntüsü yoktur

FFT Spektrum Analizi

Midjourney’nin diffusion mimarisi yüksek frekans gürültüsünü bastırır. FFT analizinde:

  • Yüksek frekans bölgesi gerçek bir fotoğrafa kıyasla anormal biçimde temizdir
  • Upscaler kaynaklı hafif grid artefaktları bazı görsellerde gözlemlenebilir
  • Spektrum bozunma eğrisi 1/f örüntüsünden sapabilir

Bu izler tek başına kesin kanıt değildir ama diğer sinyallerle birleştiğinde anlamlıdır.

EXIF Metadata: Ne Söyler, Ne Söylemez?

Midjourney görsellerinin EXIF durumu ilginçtir:

AlanDurum
Kamera markası/modeliYok
Lens bilgisiYok
GPS koordinatlarıYok
Çekim tarihi/saatiYok
Yazılım alanıBazen “Midjourney” veya “Discord”
Renk profiliGenellikle mevcut (sRGB)

EXIF verisinin yokluğu tek başına bir şey kanıtlamaz; gerçek fotoğraflar da sosyal medyada paylaşıldığında EXIF verisini kaybeder. Ancak makul bir fotoğraf için beklenen kamera bilgisinin tamamen yokluğu, diğer işaretlerle birleştiğinde değerlidir.

Yazılım Metadata’sı

Görselin hiç işlenmemiş ham hali incelenebilirse zaman zaman yazılım meta verisinde “Midjourney” ibaresi veya Discord ile ilgili bir iz bulunabilir. Ancak bu iz kolayca silinebilir veya üzerine yazılabilir.

C2PA Desteği Yok

Content Credentials (C2PA), bir görselin nasıl üretildiğini dijital imza ile belgeleyen açık bir standarttır. Adobe Firefly, Microsoft Designer ve DALL-E 3 gibi araçlar C2PA imzası eklemeye başlamıştır.

Midjourney C2PA desteklemiyor. Bu üç anlama gelir:

  1. Midjourney görselleri üretim araçlarını dijital olarak doğrulanamaz
  2. “Bu görsel yapay zeka üretimi değil” iddiasına C2PA kanıt olarak karşı çıkılamaz
  3. Sahte bir C2PA imzası eklenerek görsel “orijinal” görünebilir — bu konuda dikkatli olun

C2PA desteği olmadığında adli analiz araçlarına ve görsel ipuçlarına daha fazla güvenmek gerekir.

FakeRadar’da Midjourney Testi

FakeRadar, Midjourney görsellerini şu katmanlarla analiz eder:

  1. Hive AI sınıflandırması: Diffusion model çıktılarına özgü desenleri tanıyan özel model; Midjourney dahil birçok üretici için eğitilmiş
  2. ELA görselleştirmesi: Sıkıştırma tutarsızlıkları harita üzerinde gösterilir; upscaler artefaktları belirgin hale gelir
  3. FFT spektrum analizi: Frekans imzası gerçek fotoğraf referansıyla karşılaştırılır
  4. EXIF metadata kontrolü: Kamera bilgisinin varlığı/yokluğu ve yazılım alanı incelenir
  5. C2PA doğrulama: İmza olup olmadığı kontrol edilir; Midjourney görselleri bu adımda sıfır imza döndürür

Pro plan kapsamında tüm bu sinyaller tek bir raporda birleştirilir; her sinyal için açıklama ve güven skoru sağlanır.

Sınırlamalar ve Dürüst Değerlendirme

Midjourney tespitinde bazı sınırlamaları kabul etmek gerekir:

  • V6 ve sonrası çok daha az görsel artefakt içerir; eski versiyonlara kıyasla tespiti zorlaşmıştır
  • Görsel manipülasyon: Gerçek bir fotoğraf üzerine Midjourney ile inpainting yapılmışsa karma bir imza ortaya çıkar
  • Yeniden sıkıştırma: Sosyal medyada dolaşan görsel birden fazla kez sıkıştırılmış olabilir; bu adli izleri maskeler
  • Model evrimi: Midjourney hızla güncellenmektedir; bugün geçerli olan bir tespit yöntemi birkaç versiyondan sonra geçersiz hale gelebilir

Bu sınırlamalar, neden tek bir araç ya da tek bir analiz yönteminin yeterli olmadığını açıklar.

Sonuç

Midjourney görselleri giderek daha inandırıcı hale gelse de adli izler tamamen silinmiş değil. El anatomisi, metin hataları, “dreamlike” kalite ve ELA/FFT örüntüleri birleştiğinde güçlü bir sinyal oluşturur. C2PA desteğinin olmayışı ise üretim kaynağının doğrulanmasını daha da güçleştirmektedir.

Şüphelendiğiniz bir Midjourney görselini analiz etmek için FakeRadar’ı ücretsiz deneyin. ELA haritası, FFT spektrumu ve AI sınıflandırma sonuçları birkaç saniye içinde raporunuzda hazır olur. Daha fazla Türkçe kaynak için blog sayfamızı ziyaret edin.