Невозможно изменить язык, чтобы получить желаемый результат - PullRequest
0 голосов
/ 28 июня 2018

Я написал скрипт на python для получения содержимого (в табличном формате) сайта. Когда я выполняю свой скрипт, он успешно анализирует этот контент. Единственное, что я не могу изменить, это выбор языка.

Содержание этих сайтов на Arabic языке. Тем не менее, я намерен проанализировать это таким образом, чтобы вывод был на английском. Вот где я застрял. Я пытался с headers={"Accept-Language":"en-US,en;q=0.9"} в соответствии с этим ответом , но в этом случае он не работает. Как я могу изменить языковые опции для достижения цели?

Это мой сценарий:

import requests
from bs4 import BeautifulSoup

URL = "http://www.awm.gov.jo/dotnet/default.aspx"

req = requests.get(URL,headers={"Accept-Language":"en-US,en;q=0.9"})
soup = BeautifulSoup(req.text,"lxml")
for items in soup.select("#GV_prices tr"):
    data = [item.get_text(strip=True) for item in items.select("th,td")]
    print(data)

К вашему сведению, это была headers={"Accept-Language": "en-US,en;q=0.5"} моя первая попытка, но она тоже не сработала.

1 Ответ

0 голосов
/ 28 июня 2018

Вы пытаетесь принимать веб-сайты на американском английском языке, чтобы получить арабский язык, вы можете попробовать установить язык принятия "ar". Однако это не переведет страницу на английский для вас.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...