ГЕО локализация утечки с помощью механического суппорта - PullRequest
0 голосов
/ 29 февраля 2020

Я пытаюсь удалить некоторые данные из eBay.de, используя прокси, который находится в Германии. Я пробовал разные веб-страницы, чтобы дважды проверить это.

import mechanicalsoup

proxies = {"http": "http://.....",
           "https": "https://...."}

browser = mechanicalsoup.StatefulBrowser()
browser.session.proxies = proxies
browser.set_user_agent(
    'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_9_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/35.0.1916.47 Safari/537.36')

browser.open('https://www.ebay.de/sch/internet.shop.world/m.html?_nkw=&_armrs=1&_ipg=&_from=/de')
browser.launch_browser()

, если я пытаюсь использовать этот код без VPN, но с прокси-сервером с моим IP-адресом, расположенным за пределами Германии, я получаю здесь только одну статью.

Если я попробую то же самое с VPN с немецким vpn-сервером и без прокси, я получу здесь больше статей. Есть ли что-то, что сервер vpn позволяет ebay больше верить, что пользователь из Германии, а не просто прокси?

часовой пояс правильный с прокси.

1 Ответ

0 голосов
/ 21 марта 2020

попробуйте использовать accept-language в вашем заголовке, используя ваш язык:

headers = {# 'accept-language': 'en-GB,en-US;q=0.8,en;q=0.6,ms;q=0.4',
            'accept-language': 'fr-FR,fr;q=0.9,en-US;q=0.8,en;q=0.7',
          }
browser.set_user_agent(
'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_9_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/35.0.1916.47 Safari/537.36')

browser = mechanicalsoup.StatefulBrowser()
browser.session.proxies = {}
browser.open('https://www.ebay.de/sch/internet.shop.world/m.html?_nkw=&_armrs=1&_ipg=&_from=/de',headers=headers)
browser.launch_browser()
...