Menu

Почему Anti-Captcha превосходит новую проверку reCAPTCHA с жестами рук от Google (а ИИ-решатели — нет)

Google выпустила новый вид проверки reCAPTCHA: проверка с жестами рук. Вместо нажатия на размытые светофоры или установки галочки посетителю предлагается включить камеру и выполнить физический жест рукой — например, показать определённое количество пальцев, сложить определённую фигуру или следовать подсказке на экране в реальном времени. Это значительный переход от статических картинок-головоломок к живой, поведенческой проверке по принципу «докажи, что ты настоящий человек перед настоящей камерой».

Почему Anti-Captcha превосходит новую проверку reCAPTCHA с жестами рук от Google (а ИИ-решатели — нет)

В этой статье мы объясняем, как работает эта проверка, почему чисто автоматизированные ИИ-сервисы по решению капчи испытывают с ней трудности и почему Anti-Captcha — сервис, опирающийся на реальных людей-работников, — обладает уникальными возможностями для её прохождения.

Что такое проверка reCAPTCHA с жестами рук?

Согласно собственной документации Google, проверка работает следующим образом: пользователя просят предоставить доступ к камере, а затем выполнить движения рукой перед камерой. Система Google не сохраняет необработанное видео; вместо этого она извлекает 21 координату суставов руки (скелетный «каркас» руки) из видеопотока камеры и использует данные об этих точках, чтобы определить, выполняет ли запрошенное движение настоящий, живой человек. По данным Google, видеозапись никогда не привязывается к личности пользователя и удаляется после завершения проверки, а звук никогда не записывается. Для пользователей, которые не могут выполнять жесты, reCAPTCHA продолжает предлагать традиционные визуальные и аудиопроверки.

Технически распознавание жестов построено на том же семействе технологий, что и MediaPipe Hand Landmarker от Google, которая определяет 21 точную точку суставов на каждой руке, отличает левую руку от правой и отслеживает руку по видеокадрам в реальном времени. Таким образом, проверка — это не один снимок, а непрерывный поток движения, который должен выглядеть биомеханически и во времени как настоящая рука, движущаяся в реальном пространстве.

Почему это так трудно обойти

Классические капчи проверяют распознавание: можете ли вы прочитать этот текст, можете ли вы найти велосипеды. Это одноразовые, статические задачи, которые современное компьютерное зрение в конце концов начинает решать. Проверка с жестами рук проверяет нечто принципиально иное — живость и телесность. Она спрашивает: есть ли перед настоящей камерой физическая, трёхмерная человеческая рука, реагирующая по требованию, с естественными микродвижениями, реакцией на освещение, глубиной и таймингом живого человека?

Это полностью меняет правила игры. Проверка одновременно объединяет несколько сигналов:

  • Взаимодействие в реальном времени — жест должен быть выполнен по требованию, в ответ на подсказку, в течение определённого времени. Нет статического ресурса для предварительного анализа.
  • 3D-живость — у настоящей руки есть глубина, параллакс, текстура кожи, тени и естественное дрожание, которых нет у плоского изображения или зацикленного ролика.
  • Временная согласованность — движение должно быть непрерывным и физически правдоподобным от кадра к кадру, соответствуя 21-точечному скелету руки во времени.
  • Аппаратные сигналы — метаданные камеры, частота кадров, шум сенсора и окружение — всё это влияет на решение «является ли это подлинной съёмкой?».

Почему ИИ-решатели капчи здесь терпят неудачу

Сервисы по решению капчи на основе только ИИ отлично распознают пиксели. Они не созданы для того, чтобы физически существовать перед камерой. Проверка с жестами рук атакует именно тот пробел, который автоматизированные решатели не могут закрыть:

  • Здесь нечего «распознавать». ИИ-решатель получает изображение и возвращает ответ. Здесь же нет изображения для отправки — система требует живой видеопоток с движущейся рукой. Решателю пришлось бы сгенерировать убедительную человеческую руку в реальном времени, а не классифицировать картинку.
  • Чтобы обмануть эту проверку с помощью ИИ, вам нужно было бы создать дипфейк фотореалистичной 3D-руки в реальном времени и подавать его через виртуальную камеру. Обнаружение живости специально разработано для выявления именно этого: виртуальным камерам, повторно воспроизводимым роликам и отрисованным рукам не хватает признаков глубины, шума сенсора и естественной вариативности настоящей съёмки, и они редко проходят свежий, случайным образом запрошенный жест. Синтетические руки выявляются.
  • Подсказки динамичны. Поскольку запрашиваемый жест и тайминг меняются, предварительно отрисованный или кэшированный ответ не работает. «Решателю» приходится каждый раз импровизировать совершенно новое, физически корректное движение — тривиальная задача для человека, но крайне трудная для убедительной подделки в масштабе.
  • Планка точности постоянно растёт. Каждый раз, когда генеративная модель становится достаточно хороша, чтобы подделать жест, Google может скорректировать пороги обнаружения и добавить новые поведенческие сигналы. Статическое ИИ-распознавание всегда на шаг позади цели живости, которая по замыслу постоянно меняется.

Почему Anti-Captcha — правильный ответ

Anti-Captcha — это не ИИ-сервис. В его основе лежит глобальная сеть реальных людей-работников. Когда проверка принципиально требует реального человека — настоящей руки, настоящей камеры, настоящей реакции — самый надёжный и перспективный способ её пройти — это поручить настоящему человеку выполнить именно то, что требует проверка. Именно это и предоставляет Anti-Captcha.

  • Подлинная человеческая живость. Живой работник с настоящей камерой обеспечивает глубину, движение и естественную вариативность, которые ищет обнаружение живости, — а не отрисовку, которая должна «обойти» детектор.
  • Мгновенно адаптируется к любому новому жесту. Люди понимают и выполняют новые подсказки без переобучения модели. Когда Google меняет набор жестов или процесс, наши работники просто следуют новым инструкциям — обновление модели не требуется.
  • Устойчивость к улучшениям обнаружения. Поскольку работу выполняет реальный человек, ужесточение порогов защиты от подделки не нарушает этот подход так, как оно нарушает синтетические/ИИ-попытки. Реальные люди — это тот единственный вход, который тест «докажи, что ты человек» предназначен принимать.
  • Тот же простой API, который вы уже используете. Anti-Captcha предоставляет единый последовательный JSON API (createTaskgetTaskResult) для всех типов капчи. По мере добавления поддержки новых интерактивных проверок вы интегрируете их так же, как сегодня интегрируете reCAPTCHA, Turnstile или капчи с изображениями.
  • Скорость и масштаб. Большой, всегда доступный пул работников означает, что проверки обрабатываются быстро и круглосуточно, с конечными точками отчётности для пометки и возврата средств за неудачные попытки.

Итог

Проверка с жестами рук от Google намеренно создана так, чтобы остановить автоматизацию, требуя того, что естественным образом может предоставить только реальный человек перед настоящей камерой. Именно поэтому ИИ-решатели упираются в стену — и именно поэтому сервис, основанный на работе людей, такой как Anti-Captcha, идеально подходит. По мере того как индустрия капчи переходит от «распознай это изображение» к «докажи, что ты живой человек», преимущество решительно смещается к сервисам, в основе которых лежат реальные люди.

Хотите интегрировать решение reCaptcha от Anti-Captcha в своё приложение? Начните с документации API и создания аккаунта.