Menu

Bakit Nananalo ang Anti-Captcha Laban sa Bagong reCAPTCHA Hand Gesture Verification ng Google (at Hindi Kaya ng AI Solvers)

Inilabas ng Google ang isang bagong uri ng hamon ng reCAPTCHA: hand gesture verification. Sa halip na mag-click ng malabong traffic lights o mag-check ng kahon, hinihiling sa bisita na buksan ang kanilang kamera at gumawa ng pisikal na galaw gamit ang kanilang kamay — halimbawa pagtaas ng tiyak na bilang ng mga daliri, paggawa ng tiyak na hugis, o pagsunod sa isang prompt sa screen nang real time. Ito ay isang malaking pagbabago mula sa mga static na palaisipan ng larawan tungo sa live, behavioral, "patunayan na ikaw ay tunay na tao sa harap ng tunay na kamera" na pagpapatunay.

Bakit Nananalo ang Anti-Captcha Laban sa Bagong reCAPTCHA Hand Gesture Verification ng Google (at Hindi Kaya ng AI Solvers)

Sa artikulong ito ipinapaliwanag namin kung paano gumagana ang hamon, kung bakit nahihirapan dito ang mga purong awtomatikong serbisyo ng AI captcha-solving, at kung bakit ang Anti-Captcha — isang serbisyong sinusuportahan ng mga tunay na manggagawang tao — ay natatanging nakahanda upang harapin ito.

Ano ang reCAPTCHA hand gesture challenge?

Ayon sa sariling dokumentasyon ng Google, gumagana ang hamon sa pamamagitan ng paghiling sa user na ibigay ang pahintulot sa kamera at pagkatapos ay gumawa ng mga galaw ng kamay sa kamera. Ang sistema ng Google ay hindi nag-iimbak ng raw na video; sa halip ay kinukuha nito ang 21 hand-knuckle na koordinasyon (isang skeletal na "wireframe" ng kamay) mula sa camera feed at ginagamit ang landmark data na iyon upang magpasya kung ang isang tunay, buhay na tao ang gumagawa ng hiniling na galaw. Ayon sa Google, ang footage ay hindi kailanman naitatali sa pagkakakilanlan ng user at tinatanggal pagkatapos makumpleto ang pagpapatunay, at ang audio ay hindi kailanman naitatala. Para sa mga user na hindi makakagawa ng mga galaw, patuloy na nag-aalok ang reCAPTCHA ng tradisyunal na biswal at audio na mga hamon.

Sa teknikal na paraan, ang pagkilala sa galaw ay nakabuo sa parehong pamilya ng teknolohiya ng MediaPipe Hand Landmarker ng Google, na nakakakita ng 21 tumpak na hand-knuckle na puntos bawat kamay, nakikilala ang kaliwa sa kanan, at sinusubaybayan ang kamay sa mga video frame nang real time. Kaya naman ang pagpapatunay ay hindi isang solong snapshot — ito ay isang tuluy-tuloy na daloy ng galaw na kailangang magmukhang biomechanical at temporal na tulad ng tunay na kamay na gumagalaw sa tunay na espasyo.

Bakit napakahirap itong talunin

Sinusubok ng mga klasikong captcha ang pagkilala: kaya mo bang basahin ang tekstong ito, kaya mo bang hanapin ang mga bisikleta. Ang mga iyon ay isang-pagkakataong, static na mga problema na sa kalaunan ay naaabutan ng modernong computer vision. Ang hand gesture verification ay sumusubok ng isang bagay na pundamental na naiiba — kabuhayan at pagkakakatawan. Itinatanong nito: mayroon bang isang pisikal, tatlong-dimensyonal na kamay ng tao sa harap ng tunay na kamera, na tumutugon kapag hiniling, na may natural na micro-movements, tugon sa liwanag, lalim, at timing ng isang buhay na tao?

Iyon ay ganap na nagbabago sa laro. Pinagsasama ng hamon ang ilang signal nang sabay-sabay:

  • Real-time na interaksyon — ang galaw ay dapat gawin kapag hiniling, bilang tugon sa isang prompt, sa loob ng isang takdang panahon. Walang static na asset na maaaring suriin nang maaga.
  • 3D na kabuhayan — ang tunay na kamay ay may lalim, parallax, texture ng balat, mga anino at natural na panginginig na wala sa flat na larawan o looped na clip.
  • Pagkakatugma sa panahon — ang galaw ay dapat tuluy-tuloy at pisikal na kapani-paniwala mula frame hanggang frame, na tumutugma sa 21-point hand skeleton sa paglipas ng panahon.
  • Mga signal ng hardware — ang metadata ng kamera, frame rate, ingay ng sensor at kapaligiran ay lahat nakakaapekto sa desisyong "ito ba ay tunay na kuha?"

Bakit nabibigo dito ang mga AI-based captcha solver

Ang mga AI-only na serbisyo ng captcha-solving ay napakagaling sa pagkilala ng mga pixel. Hindi sila binuo upang pisikal na umiral sa harap ng kamera. Tinatamaan ng hand gesture challenge ang eksaktong puwang na hindi kayang punan ng mga awtomatikong solver:

  • Walang dapat "kilalanin." Ang isang AI solver ay tumatanggap ng larawan at nagbabalik ng sagot. Dito, walang larawang ipapadala — hinihiling ng sistema ang live na camera stream ng gumagalaw na kamay. Kailangang bumuo ng ng solver ang isang kapani-paniwalang real-time na kamay ng tao, hindi mag-uri ng larawan.
  • Nahuhuli ang mga synthetic na kamay. Upang lokohin ang hamon gamit ang AI, kailangan mong mag-deepfake ng photorealistic na 3D na kamay nang real time at ipadala ito sa pamamagitan ng virtual camera. Ang liveness detection ay partikular na ginawa upang ma-flag ang eksaktong ito: ang mga virtual camera, ipinasang muling clip, at na-render na mga kamay ay kulang sa mga depth cue, ingay ng sensor at natural na pagkakaiba-iba ng tunay na kuha, at bihira silang makaligtas sa isang bago, random na hiniling na galaw.
  • Dinamiko ang mga prompt. Dahil nag-iiba-iba ang hiniling na galaw at timing, hindi gumagana ang isang pre-rendered o cached na tugon. Kailangang mag-improvise ng "solver" ng isang bagong-bago, pisikal na tamang galaw sa bawat pagkakataon — napakadali para sa tao, napakahirap pekein nang kapani-paniwala sa malaking saklaw.
  • Patuloy na tumataas ang bar ng katumpakan. Sa tuwing ang isang generative model ay sapat nang magaling upang pekein ang isang galaw, maaaring iayos ng Google ang mga threshold ng detection at magdagdag ng mga bagong behavioral signal. Ang static na AI recognition ay palaging isang hakbang ang likod sa isang liveness target na dinisenyo upang gumalaw.

Bakit ang Anti-Captcha ang tamang sagot

Ang Anti-Captcha ay hindi isang serbisyo ng AI. Sa pinakaubod nito ay isang pandaigdigang network ng tunay na manggagawang tao. Kapag ang isang hamon ay pundamental na nangangailangan ng tunay na tao — tunay na kamay, tunay na kamera, tunay na reaksyon — ang pinakamatatag at pinaka-handa-sa-hinaharap na paraan upang ipasa ito ay magkaroon ng tunay na taong gumagawa ng eksaktong hinihiling ng hamon. Iyon mismo ang ibinibigay ng Anti-Captcha.

  • Tunay na kabuhayan ng tao. Ang isang buhay na manggagawa na may tunay na kamera ay gumagawa ng lalim, galaw at natural na pagkakaiba-iba na hinahanap ng liveness detection — hindi isang render na kailangang "talunin" ang isang detector.
  • Agad na umaangkop sa anumang bagong galaw. Nauunawaan at ginagawa ng mga tao ang mga bagong prompt nang hindi muling sinasanay ang isang model. Kapag binago ng Google ang set ng galaw o ang daloy, basta sumusunod lamang ang aming mga manggagawa sa mga bagong tagubilin — walang kinakailangang update sa model.
  • Matatag sa mga upgrade ng detection. Dahil ang trabaho ay ginagawa ng tunay na tao, ang paghihigpit sa mga anti-spoofing threshold ay hindi sumisira sa diskarte tulad ng pagkasira nito sa synthetic/AI na mga pagtatangka. Ang mga tunay na tao ang isang input na ang isang "patunayan na ikaw ay tao" na pagsubok ay dinisenyo upang tanggapin.
  • Parehong simpleng API na ginagamit mo na. Ang Anti-Captcha ay naglalantad ng isang pare-parehong JSON API (createTaskgetTaskResult) sa bawat uri ng captcha. Habang nadaragdag ang suporta para sa mga bagong interactive na hamon, isinasama mo ito sa parehong paraan na isinasama mo ang reCAPTCHA, Turnstile o mga image captcha ngayon.
  • Bilis at saklaw. Ang isang malaki, palaging-naka-on na pool ng manggagawa ay nangangahulugang mabilis na nahaharap ang mga hamon at buong araw, na may mga reporting endpoint upang i-flag at i-refund ang mga nabigong pagtatangka.

Ang konklusyon

Ang hand gesture verification ng Google ay sadyang binuo upang pigilan ang awtomasyon sa pamamagitan ng paghingi ng isang bagay na tanging tunay na tao sa harap ng tunay na kamera lamang ang natural na makakapagbigay. Iyon mismo ang dahilan kung bakit natatamaan ng pader ang mga AI-only na solver — at kung bakit ang isang serbisyong pinatatakbo ng tao tulad ng Anti-Captcha ang natural na akma. Habang ang industriya ng captcha ay lumilipat mula sa "kilalanin ang larawang ito" tungo sa "patunayan na ikaw ay buhay na tao," ang bentahe ay tiyak na lumilipat sa mga serbisyong may tunay na tao sa kanilang ubod.

Gusto mo bang isama ang reCaptcha solving ng Anti-Captcha sa iyong aplikasyon? Magsimula sa dokumentasyon ng API at isang paggawa ng account.