Startsida Dokumentation Guider Logga in
Typer av uppdrag som stöds
API-metoder
Artiklar
Guider
GitHub
Dokumentationsmenyn

Hur du använder Anti-Captcha-tillägget med Puppeteer eller Selenium

Puppeteer och Selenium är två vanliga webbläsarmotorer för webbläsarautomatisering och vårt tillägg kan integreras sömlöst med dem. I den här artikeln går vi igenom hur du använder det i Puppeteer och Selenium med programmering dels i NodeJS och dels i Python. Om du är osäker på vilken kombination du bör välja så rekommenderar vi NodeJS+Puppeteer på grund av dess nativa miljö.

1. Installera nödvändiga tillägg. Till NodeJS behöver du bara installera npm-paketen nedan. Till Python, installera paketen och ladda ner "chromedriver"-filen från den här sidan. Versionen måste vara samma som den Chrome-version du har installerad på systemet.

NodeJS
     npm install adm-zip puppeteer puppeteer-extra puppeteer-extra-plugin-stealth
    
Python
     pip install selenium
    

2. Ladda ner tillägget som zip-fil för Chrome och packa sedan upp filen till din projektmapp. Versionerna finns tillgängliga här. Du kan också göra det i programkoden:

NodeJS
     //npm install adm-zip
const https = require('https')
const fs = require('fs');
const AdmZip = require("adm-zip");

const pluginURL = 'https://antcpt.com/anticaptcha-plugin.zip';

(async () => {
  // ladda ner tillägget
  await new Promise((resolve) => {
    https.get(pluginURL, resp => resp.pipe(fs.createWriteStream('./plugin.zip').on('close', resolve)));
  })
  // packa upp
  const zip = new AdmZip("./plugin.zip");
  await zip.extractAllTo("./plugin/", true);
})();
    
Python
     import urllib.request
import zipfile

url = 'https://antcpt.com/anticaptcha-plugin.zip'
# ladda ner tillägget
filehandle, _ = urllib.request.urlretrieve(url)
# packa upp
with zipfile.ZipFile(filehandle, "r") as f:
  f.extractall("plugin")
    

3. Konfigurera sedan din API-nyckel i filen ./plugin/js/config_ac_api_key.js. API-nyckeln hittar du i kundportalen. Du behöver ha pengar på ditt saldo för att det ska fungera.

NodeJS
     const apiKey = 'API_KEY_32_BYTES';
if (fs.existsSync('./plugin/js/config_ac_api_key.js')) {
  let confData = fs.readFileSync('./plugin/js/config_ac_api_key.js', 'utf8');
  confData = confData.replace(/antiCapthaPredefinedApiKey = ''/g, `antiCapthaPredefinedApiKey = '${apiKey}'`);
  fs.writeFileSync('./plugin/js/config_ac_api_key.js', confData, 'utf8');
} else {
  console.error('plugin configuration not found!')
}
    
Python
     from pathlib import Path
import zipfile

# lägg till API-nyckeln i konfigurationsfilen
api_key = "API_KEY_32_BYTES"
file = Path('./plugin/js/config_ac_api_key.js')
file.write_text(file.read_text().replace("antiCapthaPredefinedApiKey = ''", "antiCapthaPredefinedApiKey = '{}'".format(api_key)))

# komprimera tillbaka pluginmappen till plugin.zip
zip_file = zipfile.ZipFile('./plugin.zip', 'w', zipfile.ZIP_DEFLATED)
for root, dirs, files in os.walk("./plugin"):
    for file in files:
      path = os.path.join(root, file)
      zip_file.write(path, arcname=path.replace("./plugin/", ""))
zip_file.close()
    

4. Starta webbläsaren med tillägget. Till Puppeteer rekommenderar vi tillägget "puppeteer-extra-plugin-stealth" till "puppeteer-extra"-paketet. Det lämnar inga spår efter webbläsarautomatisering.

NodeJS
     //npm install puppeteer puppeteer-extra puppeteer-extra-plugin-stealth
const puppeteer = require('puppeteer-extra');
const StealthPlugin = require('puppeteer-extra-plugin-stealth');
puppeteer.use(StealthPlugin());

(async () => {
  const browser = await puppeteer.launch({
    headless: false,
    ignoreDefaultArgs: [
      "--disable-extensions",
      "--enable-automation"
    ],
    args: [
      '--disable-web-security',
      '--disable-features=IsolateOrigins,site-per-process',
      '--allow-running-insecure-content',
      '--disable-blink-features=AutomationControlled',
      '--no-sandbox',
      '--mute-audio',
      '--no-zygote',
      '--no-xshm',
      '--window-size=1920,1080',
      '--no-first-run',
      '--no-default-browser-check',
      '--disable-dev-shm-usage',
      '--disable-gpu',
      '--enable-webgl',
      '--ignore-certificate-errors',
      '--lang=en-US,en;q=0.9',
      '--password-store=basic',
      '--disable-gpu-sandbox',
      '--disable-software-rasterizer',
      '--disable-background-timer-throttling',
      '--disable-backgrounding-occluded-windows',
      '--disable-renderer-backgrounding',
      '--disable-infobars',
      '--disable-breakpad',
      '--disable-canvas-aa',
      '--disable-2d-canvas-clip-aa',
      '--disable-gl-drawing-for-tests',
      '--enable-low-end-device-mode',
      '--disable-extensions-except=./plugin',
      '--load-extension=./plugin'
    ]
  });
  const page = await browser.newPage();
})();
    
Python
     from selenium import webdriver

options = webdriver.ChromeOptions()
options.add_extension('./plugin.zip')

browser = webdriver.Chrome('./chromedriver', options=options)
    

5. Gå till målsidan och fyll i nödvändiga formulär. Tillägget identifierar Recaptcha automatiskt och börjar sedan lösa den.

NodeJS
     (async () => {
  const url = 'https://anti-captcha.com/demo/?page=recaptcha_v2_textarea';
  const login = 'Test login';
  const password = 'Test password';

  try {
    await page.goto(url, {
      waitUntil: "networkidle0"
    });
  } catch (e) {
    console.error('err while loading the page: '+e);
  }
  // inaktivera felmeddelanden för navigationstimeouts
  await page.setDefaultNavigationTimeout(0);

  await page.$eval('#login', (element, login) => {
    element.value = login;
  }, login);
  await page.$eval('#password', (element, password) => {
    element.value = password;
  }, password);

})();
    
Python
     browser.get('https://anti-captcha.com/demo/?page=recaptcha_v2_textarea')

# filling form
browser.find_element_by_css_selector('#login').send_keys('Test login')
browser.find_element_by_css_selector('#password').send_keys('Test password')

    

6. Nästa steg är lite klurigt. Vissa webbformulär kräver att användaren trycker på skicka-knappen efter att Recaptchan har lösts, andra använder callback-funktioner och skickar dem automatiskt. I det första fallet vill vi trycka på skicka-knappen direkt efter att Recaptchan har lösts. För att kunna göra det vid rätt tidpunkt, vänta helt enkelt på att selektorn .antigate_solver.solved dyker upp och tryck sedan på skicka-knappen.

NodeJS
     // vänta på selektorn "solved"
await page.waitForSelector('.antigate_solver.solved').catch(error => console.log('failed to wait for the selector'));
console.log('recaptchan löst');

// tryck på skicka-knappen
await Promise.all([
  page.click('#submitButton'),
  page.waitForNavigation({ waitUntil: "networkidle0" })
]);
console.log('uppdraget slutfört, formulär med Recaptcha löst');
    
Python
     # vänta på selektorn "solved"
webdriver.support.wait.WebDriverWait(browser, 120).until(lambda x: x.find_element_by_css_selector('.antigate_solver.solved'))
# tryck på skicka-knappen
browser.find_element_by_css_selector('#submitButton').click()
    

Det var allt! Formuläret är ifyllt och Recaptchan är löst. Kodexempel i sin helhet:

NodeJS
     // first run the following to install required npm packages:
//
// npm install adm-zip follow-redirects puppeteer puppeteer-extra puppeteer-extra-plugin-stealth
//
//
const https = require('follow-redirects').https;
const fs = require('fs');
const AdmZip = require("adm-zip");

const apiKey = 'YOUR_API_KEY_HERE!';
const pluginURL = 'https://antcpt.com/anticaptcha-plugin.zip';
const url = 'https://anti-captcha.com/demo/?page=recaptcha_v2_textarea';
const login = 'Test login';
const password = 'Test password';
let page = null;


const puppeteer = require('puppeteer-extra');
const StealthPlugin = require('puppeteer-extra-plugin-stealth');
puppeteer.use(StealthPlugin());

(async () => {
  // ladda ner tillägget
  await new Promise((resolve) => {
    https.get(pluginURL, resp => resp.pipe(fs.createWriteStream('./plugin.zip').on('close', resolve)));
  })
  // packa upp
  const zip = new AdmZip("./plugin.zip");
  await zip.extractAllTo("./plugin/", true);

  // lägg till API-nyckeln i konfigurationsfilen
  await new Promise((resolve, reject) => {
    if (fs.existsSync('./plugin/js/config_ac_api_key.js')) {
      let confData = fs.readFileSync('./plugin/js/config_ac_api_key.js', 'utf8');
      confData = confData.replace(/antiCapthaPredefinedApiKey = ''/g, `antiCapthaPredefinedApiKey = '${apiKey}'`);
      fs.writeFileSync('./plugin/js/config_ac_api_key.js', confData, 'utf8');
      resolve();
    } else {
      console.error('plugin configuration not found!')
      reject();
    }
  });

  // ställ in webbläsarens inställningar
  const options = {
    headless: false,
    ignoreDefaultArgs: [
      "--disable-extensions",
      "--enable-automation"
    ],
    args: [
      '--disable-web-security',
      '--disable-features=IsolateOrigins,site-per-process',
      '--allow-running-insecure-content',
      '--disable-blink-features=AutomationControlled',
      '--no-sandbox',
      '--mute-audio',
      '--no-zygote',
      '--no-xshm',
      '--window-size=1920,1080',
      '--no-first-run',
      '--no-default-browser-check',
      '--disable-dev-shm-usage',
      '--disable-gpu',
      '--enable-webgl',
      '--ignore-certificate-errors',
      '--lang=en-US,en;q=0.9',
      '--password-store=basic',
      '--disable-gpu-sandbox',
      '--disable-software-rasterizer',
      '--disable-background-timer-throttling',
      '--disable-backgrounding-occluded-windows',
      '--disable-renderer-backgrounding',
      '--disable-infobars',
      '--disable-breakpad',
      '--disable-canvas-aa',
      '--disable-2d-canvas-clip-aa',
      '--disable-gl-drawing-for-tests',
      '--enable-low-end-device-mode',
      '--disable-extensions-except=./plugin',
      '--load-extension=./plugin'
    ]
  }

  try {
    // starta webbläsaren med tillägget
    const browser = await puppeteer.launch();
    page = await browser.newPage();
  } catch (e) {
    console.log('could not launch browser: '+e.toString())
    return;
  }

  // gå till målsidan
  try {
    await page.goto(url, {
      waitUntil: "networkidle0"
    });
  } catch (e) {
    console.error('err while loading the page: '+e);
  }

  // inaktivera felmeddelanden för navigationstimeouts
  await page.setDefaultNavigationTimeout(0);

  // fyll i formuläret
  await page.$eval('#login', (element, login) => {
    element.value = login;
  }, login);
  await page.$eval('#password', (element, password) => {
    element.value = password;
  }, password);

  // vänta på selektorn "solved"
  await page.waitForSelector('.antigate_solver.solved').catch(error => console.log('failed to wait for the selector'));
  console.log('recaptchan löst');

  // tryck på skicka-knappen
  await Promise.all([
    page.click('#submitButton'),
    page.waitForNavigation({ waitUntil: "networkidle0" })
  ]);
  console.log('recaptchan löst');

})();
    
Python
     import urllib.request
import zipfile
import os
from pathlib import Path
from selenium import webdriver

# ladda ner tillägget
url = 'https://antcpt.com/anticaptcha-plugin.zip'
filehandle, _ = urllib.request.urlretrieve(url)
# packa upp
with zipfile.ZipFile(filehandle, "r") as f:
  f.extractall("plugin")

# lägg till API-nyckeln i konfigurationsfilen
api_key = "YOUR_API_KEY_HERE!"
file = Path('./plugin/js/config_ac_api_key.js')
file.write_text(file.read_text().replace("antiCapthaPredefinedApiKey = ''", "antiCapthaPredefinedApiKey = '{}'".format(api_key)))

# komprimera tillbaka pluginmappen till plugin.zip
zip_file = zipfile.ZipFile('./plugin.zip', 'w', zipfile.ZIP_DEFLATED)
for root, dirs, files in os.walk("./plugin"):
    for file in files:
      path = os.path.join(root, file)
      zip_file.write(path, arcname=path.replace("./plugin/", ""))
zip_file.close()

# ställ in webbläsarens inställningar
options = webdriver.ChromeOptions()
options.add_extension('./plugin.zip')

# ställ in webbläsarens inställningar
browser = webdriver.Chrome('./chromedriver', options=options)

# gå till målsidan
browser.get('https://anti-captcha.com/demo/?page=recaptcha_v2_textarea')

# fyll i formuläret
browser.find_element_by_css_selector('#login').send_keys('Test login')
browser.find_element_by_css_selector('#password').send_keys('Test password')

# vänta på selektorn "solved"
webdriver.support.wait.WebDriverWait(browser, 120).until(lambda x: x.find_element_by_css_selector('.antigate_solver.solved'))

# tryck på skicka-knappen
browser.find_element_by_css_selector('#submitButton').click()
    

Bonus: det finns ett knep för att köra tillägget i huvudlöst läge, eftersom Chrome inte stöder webbläsarautomatisering med tillägg. Använd verktyget Xvfb. Det skapar ett virtuellt skrivbord för din applikation.

bash
     # installera paketet
apt-get install -y xvfb

# ange display-varibeln
export DISPLAY=:0

# starta en Xvfb-daemon i bakgrunden (endast en gång)
/usr/bin/Xvfb :0 -screen 0 1024x768x24 &

# vänta ett par sekunder tills den dyker upp (endast en gång)
sleep 5

# lägg till prefixet "xvfb-run" i ditt "Node"- eller "Python"-skript
xvfb-run node myscript.js
# eller
xvfb-run python myscript.py