Anti-Captcha, Google'ın Yeni reCAPTCHA El Hareketi Doğrulamasını Neden Yener (ve Yapay Zeka Çözücüleri Yenemez)

Google, yeni bir reCAPTCHA zorluğu türünü kullanıma sundu: el hareketi doğrulaması. Ziyaretçiden bulanık trafik ışıklarına tıklaması ya da bir kutuyu işaretlemesi yerine, kamerasını açması ve eliyle fiziksel bir hareket yapması isteniyor — örneğin belirli sayıda parmak göstermesi, belirli bir şekil oluşturması ya da ekrandaki bir yönergeyi gerçek zamanlı olarak takip etmesi gibi. Bu, statik görsel bulmacalardan canlı, davranışsal, "gerçek bir kamera önünde gerçek bir insan olduğunuzu kanıtlayın" doğrulamasına doğru büyük bir kayıştır.

Bu makalede zorluğun nasıl çalıştığını, tamamen otomatik yapay zeka tabanlı captcha çözme hizmetlerinin neden bununla zorlandığını ve gerçek insan çalışanlarla desteklenen bir hizmet olan Anti-Captcha'nın bunu çözmek için neden benzersiz bir konumda olduğunu açıklıyoruz.

reCAPTCHA el hareketi zorluğu nedir?

Google'ın kendi belgelerine göre zorluk, kullanıcıdan kamera izni vermesini ve ardından kamera önünde el hareketleri yapmasını isteyerek çalışır. Google'ın sistemi ham videoyu saklamaz; bunun yerine kamera akışından 21 el eklem koordinatı (elin iskeletsel bir "tel kafes" modelini) çıkarır ve gerçek, yaşayan bir insanın istenen hareketi yapıp yapmadığına karar vermek için bu işaret noktası verisini kullanır. Google'a göre görüntü hiçbir zaman bir kullanıcı kimliğiyle ilişkilendirilmez ve doğrulama tamamlandıktan sonra silinir, ses ise hiçbir zaman kaydedilmez. Hareket yapamayan kullanıcılar için reCAPTCHA, geleneksel görsel ve işitsel zorlukları sunmaya devam eder.

Teknik olarak, el hareketi tanıma, Google'ın MediaPipe Hand Landmarker teknolojisiyle aynı teknoloji ailesi üzerine kuruludur; bu teknoloji her el için 21 hassas el eklem noktasını algılar, sağı soldan ayırt eder ve eli video kareleri boyunca gerçek zamanlı olarak takip eder. Bu nedenle doğrulama tek bir anlık görüntü değildir — biyomekanik ve zamansal olarak gerçek bir uzayda hareket eden gerçek bir el gibi görünmesi gereken sürekli bir hareket akışıdır.

Bunu yenmek neden bu kadar zor

Klasik captcha'lar tanımayı test eder: bu metni okuyabilir misin, bisikletleri bulabilir misin. Bunlar, modern bilgisayarla görmenin sonunda yetişeceği tek seferlik, statik problemlerdir. El hareketi doğrulaması ise temelde farklı bir şeyi test eder — canlılık ve fiziksel varlık. Şunu sorar: gerçek bir kamera önünde, istek üzerine tepki veren, yaşayan bir insanın doğal mikro hareketlerine, ışık tepkisine, derinliğine ve zamanlamasına sahip fiziksel, üç boyutlu bir insan eli var mı?

Bu, oyunu tamamen değiştirir. Zorluk aynı anda birden fazla sinyali birleştirir:

Gerçek zamanlı etkileşim — hareket, bir yönergeye yanıt olarak, bir zaman aralığı içinde istek üzerine üretilmelidir. Önceden analiz edilecek statik bir varlık yoktur.
3B canlılık — gerçek bir elin, düz bir görüntüde ya da döngüye alınmış bir klipte olmayan derinliği, paralaksı, deri dokusu, gölgeleri ve doğal titremesi vardır.
Zamansal tutarlılık — hareketin kareden kareye sürekli ve fiziksel olarak akla yatkın olması, zaman içinde 21 noktalı el iskeletiyle eşleşmesi gerekir.
Donanım sinyalleri — kamera meta verileri, kare hızı, sensör gürültüsü ve ortamın tamamı "bu gerçek bir yakalama mı?" kararına katkıda bulunur.

Yapay zeka tabanlı captcha çözücüler burada neden başarısız olur

Yalnızca yapay zekaya dayanan captcha çözme hizmetleri pikselleri tanımakta mükemmeldir. Bir kamera önünde fiziksel olarak var olmak için tasarlanmamışlardır. El hareketi zorluğu, tam olarak otomatik çözücülerin kapatamayacağı boşluğa saldırır:

"Tanınacak" hiçbir şey yoktur. Bir yapay zeka çözücü bir görüntü alır ve bir yanıt döndürür. Burada gönderilecek bir görüntü yoktur — sistem, hareket eden bir elin canlı kamera akışını talep eder. Çözücünün bir resmi sınıflandırması değil, ikna edici bir gerçek zamanlı insan eli üretmesi gerekir.
Sentetik eller yakalanır. Zorluğu yapay zekayla kandırmak için, gerçek zamanlı olarak fotogerçekçi bir 3B eli deepfake ile oluşturmanız ve bunu sanal bir kamera üzerinden beslemeniz gerekir. Canlılık algılaması tam olarak bunu işaretlemek için tasarlanmıştır: sanal kameralar, yeniden oynatılan klipler ve oluşturulmuş eller gerçek bir yakalamanın derinlik ipuçlarından, sensör gürültüsünden ve doğal değişkenliğinden yoksundur ve yeni, rastgele istenen bir hareketi nadiren atlatabilirler.
Yönergeler dinamiktir. İstenen hareket ve zamanlama değiştiğinden, önceden oluşturulmuş veya önbelleğe alınmış bir yanıt işe yaramaz. "Çözücünün" her seferinde yepyeni, fiziksel olarak doğru bir hareketi doğaçlamayla yapması gerekir — bir insan için önemsiz, ancak büyük ölçekte ikna edici şekilde taklit etmek son derece zordur.
Doğruluk çıtası sürekli yükseliyor. Üretken bir model bir hareketi taklit edecek kadar iyi hale geldiğinde, Google algılama eşiklerini ayarlayabilir ve yeni davranışsal sinyaller ekleyebilir. Statik yapay zeka tanıma, hareket etmek için tasarlanmış bir canlılık hedefinin her zaman bir adım gerisindedir.

Anti-Captcha neden doğru cevap

Anti-Captcha bir yapay zeka hizmeti değildir. Özünde, küresel bir gerçek insan çalışanlar ağı vardır. Bir zorluk temelde gerçek bir insanı gerektirdiğinde — gerçek bir el, gerçek bir kamera, gerçek bir tepki — onu geçmenin en sağlam ve geleceğe dönük yolu, zorluğun istediği şeyi tam olarak yapacak gerçek bir insanın bulunmasıdır. Anti-Captcha'nın sağladığı tam olarak budur.

Gerçek insan canlılığı. Gerçek bir kameraya sahip yaşayan bir çalışan, bir algılayıcıyı "yenmek" zorunda olan bir oluşturma değil, canlılık algılamasının aradığı derinliği, hareketi ve doğal değişkenliği üretir.
Her yeni harekete anında uyum sağlar. İnsanlar, bir modeli yeniden eğitmeye gerek kalmadan yeni yönergeleri anlar ve uygular. Google hareket setini ya da akışı değiştirdiğinde, çalışanlarımız yalnızca yeni talimatları izler — herhangi bir model güncellemesi gerekmez.
Algılama yükseltmelerine dayanıklı. İş gerçek bir kişi tarafından yapıldığından, sahteciliği önleme eşiklerini sıkılaştırmak, sentetik/yapay zeka denemelerini bozduğu gibi bu yaklaşımı bozmaz. Gerçek insanlar, bir "insan olduğunuzu kanıtlayın" testinin kabul etmek üzere tasarlandığı tek girdidir.
Zaten kullandığınız aynı basit API. Anti-Captcha, her captcha türü için tutarlı tek bir JSON API'si (createTask → getTaskResult) sunar. Yeni etkileşimli zorluklar için destek eklendikçe, onu bugün reCAPTCHA, Turnstile ya da görsel captcha'ları entegre ettiğiniz şekilde entegre edersiniz.
Hız ve ölçek. Geniş, her zaman aktif bir çalışan havuzu, zorlukların hızlı ve günün her saati çözülmesi anlamına gelir; başarısız denemeleri işaretlemek ve iadesini sağlamak için raporlama uç noktaları sunulur.

Sonuç olarak

Google'ın el hareketi doğrulaması, yalnızca gerçek bir kamera önündeki gerçek bir insanın doğal olarak sağlayabileceği bir şeyi talep ederek otomasyonu durdurmak için bilinçli olarak tasarlanmıştır. yalnızca yapay zekaya dayanan çözücülerin bir duvara toslamasının sebebi tam olarak budur — ve Anti-Captcha gibi insan gücüne dayalı bir hizmetin neden doğal bir uyum sağladığının sebebi de tam olarak budur. Captcha sektörü "bu görüntüyü tanı" yaklaşımından "yaşayan bir insan olduğunuzu kanıtlayın" yaklaşımına kaydıkça, avantaj kesin olarak özünde gerçek insanlara sahip hizmetlere geçiyor.

Anti-Captcha'nın reCaptcha çözümünü uygulamanıza entegre etmek mi istiyorsunuz? API belgeleri ve bir hesap oluşturma ile başlayın.