Arizona, Georgia ve Güney Florida Üniversitelerinden bir araştırma ekibi, karanlık web sitelerindeki gerçek zorlukların %94,4’ünün üstesinden gelebileceğini iddia ettikleri makine öğrenimi tabanlı bir CAPTCHA çözücüsü geliştirdiler.
Çalışmanın amacı, şu anda CAPTCHA’ları manuel olarak çözmek için insan katılımını gerektiren siber tehdit istihbaratını düzene sokabilecek bir sistem oluşturmaktı.
Siber suç maliyetleri, her gün gerçekleşen siber saldırılar ve veri ihlalleriyle katlanarak artıyor. Bu nedenle, karanlık ağı araştırma için daha şeffaf hale getirmenin bir yolunun bulunması, hedefe yönelik önleyici eylemde bulunmanın anahtarıdır.
Karanlık web CAPTCHA’ları
CAPTCHA (Computers and Humans Apart’ı anlatmak için Tamamen Otomatik Halka Açık Turing testi), web siteleri tarafından gerçek kullanıcılar ve botlar arasında ayrım yapmak için kullanılır.
Bu zorluklar, platformları rakip platformların birbirine karşı başlattığı sürekli DDoS saldırılarından korumak için karanlık ağda her yerde mevcuttur.
Bu DDoS saldırıları botnet’ler tarafından gerçekleştirilir ve bu nedenle giriş sayfasında güçlü bir CAPTCHA katmanına sahip olmak tehdidi kontrol altında tutabilir.
Bununla birlikte, her web sitesi kendi özel CAPTCHA mücadelesini uygulayarak çoğunu çözebilecek bir araç geliştirmeyi neredeyse imkansız hale getirir.
Bu nedenle, çalışanların CAPTCHA çözüm adımına dahil olması gerektiğinden, yasa dışı dark web pazarlarından ve forumlarından siber tehdit istihbaratının toplanması zorlu ve pahalı hale geliyor.
Makine öğrenimi yaklaşımı
Bu pratik sorunu çözmek için araştırmacılar, rasterleştirilmiş görüntülerin yorumlanmasından niteliksel olarak farklı olan bir sistem geliştirdiler. diğer son çalışmalar aynı zamanda üretken, çekişmeli ağ tabanlı yaklaşımları da kullandı.
Yeni çözücü, harfleri ve sayıları tek tek bakarak, görüntüdeki gürültüyü azaltarak, harfler arasındaki sınırları belirleyerek ve içeriği tek tek karakterlere bölerek ayırt edebilir.
Bu nedenle, CAPTCHA sorununun boyutu, özellikle üç deneme için birikmiş performansı ölçerken, çözücünün etkinliğini fazla etkilemez.
Karakter tanıma açısından, çözücü, çizgiler ve kenarlar gibi ince taneli özellikleri tanımlamak için birden çok yerel bölgeden çıkarılan örnekleri kullanır, böylece karakter döndürme, yazı tipi boyutu değişiklikleri veya renk karışıklıklarıyla “kandırılamaz”.
Gerçek dünya testi
Araştırmacılar, en optimize edilmiş DW-GAN çözüm modellerini kullanarak, yasa dışı içerik listelerine ev sahipliği yapan şu anda feshedilmiş bir karanlık web pazarı olan Yellow Brick’e karşı test etti.
Olarak kağıt açıklar:
DW-GAN’ımız tarafından geliştirilmiş bir tarayıcı kullanarak, Sarı Tuğla’dan 1.831 yasa dışı ürün toplayabildik. Bu ürünler arasında 102 çalıntı kredi kartı, 131 çalıntı hesap, 9 sahte belge taraması, 44 bilgisayar korsanlığı aracı ve 1.223 uyuşturucuyla ilgili ürün dahil olmak üzere 286 siber güvenlikle ilgili ürün vardı.
Genel olarak, DW-GAN ile “Sarı Tuğla” pazar istihbaratının toplanması, insan müdahalesi olmadan yaklaşık 5 saat sürdü. Özellikle, her HTTP isteğinin yeni bir web sayfasının yüklenmesi 8,8 saniye sürmüştür; bu nedenle 1.831 sayfanın taranması 268.5 dakika sürmüştür. Yinelenen CAPTCHA zorluklarını çözmek (15 HTTP isteği başına) DW-GAN tarayıcımız 18,6 saniye sürdü.
Genel olarak, önerilen çerçeve, CAPTCHA’yı en fazla üç denemeyle otomatik olarak bozabilir. Tüm CAPTCHA görüntülerini kırmak yaklaşık 76 dakika sürer [sic] 1.831 ürün sayfasının tamamı için toplamda tam otomatik bir süreç.
Tabii ki, bu test verileri belirli bir karanlık web pazarını ilgilendiriyor, ancak araştırmacılara göre CAPTCHA kelimesini kullanan herhangi bir sitede benzer bir performans seviyesi bekleniyor.
potansiyel etkiler
Bunun gibi zeka ve yüksek yetenekli CAPTCHA çözücüleri, en azından daha az karmaşık zorlukların kullanıldığı karanlık ağda, alanı potansiyel olarak bozabilir.
Yazarlar, çözücülerinin son halini yayınladılar. GitHub’da, ancak 50.000 CAPTCHA görüntüsünden oluşan eğitim veri seti değil.
Birisi muhtemelen zayıf clearnet CAPTCHA uygulamalarında da çalışan bir şey türetmek için bu model üzerinde çalışabilir.
Makalenin bu olasılığı vurguladığı gibi: “Bu çalışma, daha zorlu bir problem olarak esas olarak karanlık ağ CAPTCHA’ya odaklanırken, bu çalışmada önerilen yöntemin, genellik kaybı olmaksızın diğer CAPTCHA türlerine uygulanabilir olması bekleniyor.”
Bu yeni çözücü, siber suçlarla mücadele gibi asil bir amaç için geliştirilmiş olabilir, ancak yine de karanlık ağı anonimlik ve güvenli bilgi alışverişi için kullananları etkileme potansiyeline sahiptir.