Невозможно обработать некоторые данные в удобочитаемом формате - PullRequest
0 голосов
/ 24 апреля 2020

Я создал скрипт в python, используя запросы в сочетании с BeautifulSoup для извлечения табличного контента с этой веб-страницы , но когда я запускаю скрипт, я получаю некоторые нечитаемые материалы как следующее.

Усеченная часть:

SA÷1¬~ZA÷ENGLAND: Premier League¬ZEE÷dYlOSQOD¬ZB÷198¬ZY÷England¬ZC÷v1t6uXL7¬ZD÷t¬ZE÷zoZ4r7jR¬ZF÷0¬ZO÷0¬ZG÷1¬ZH÷198_dYlOSQOD¬ZJ÷2¬ZL÷/football/england/premier-league/¬ZX÷00England     007ngland0000000000001000Premier Leag014League000¬ZCC÷0¬ZAF÷England¬~AA÷UFOgEYGu¬AD÷1557669600¬ADE÷1557669600¬AB÷3¬CR÷3¬AC÷3¬CX÷Brighton¬ER÷Round

Я пробовал с:

import requests
from bs4 import BeautifulSoup

link = "https://www.flashscore.com/football/england/premier-league-2018-2019/results/"

r = requests.get(link)
soup = BeautifulSoup(r.text,"lxml")
results = soup.select_one("#tournament-page-data-results").get_text(strip=True)
print(results)

Как я могу обработать данные в читаемый человеком формат?

PS Мне не нужен ни один раствор на основе селена.

...