Я изо всех сил пытаюсь использовать XPath в HTML-коде для поиска необходимой мне информации.
Я пробовал несколько запросов, но они продолжают возвращать пустой список в Python.Поэтому я установил плагин chrome, чтобы проверить, не ошиблись ли мои запросы, оказалось, что это не так, поэтому я полностью запутался.Весь мой подход неверен или я что-то здесь упускаю?
import requests
from lxml import html
#specify the url
base_url = 'https://www.lolesports.com/en_US/na-
lcs/na_2018_summer/schedule/regular_season/2'
#query the website and return the html to the variable ‘html_code’
html_code = requests.get(base_url)
tree = html.fromstring(html_code.content)
my_nodes = tree.xpath('//a[@id="ember9461"]') ## here it keeps returning an empty list
Пробовал несколько запросов, которые не все работают, кроме широкого подстановочного знака "// *", который я не могу проанализировать дальше.
Я хочу проанализировать ссылки, предоставленные в href (например) 'a id = "ember9461" ....... / a' для каждой игры в неделю.Так что было бы лучше вернуть список со всеми этими ссылками или хотя бы что-то, содержащее ссылки, которые я могу проанализировать.Но, как я уже говорил, я продолжаю получать пустой массив, хотя это правильный XPath, показанный из плагина XPath от Chrome.
Любая помощь приветствуется.Спасибо!
Это мой первый вопрос здесь, я вернусь, чтобы добавить скриншоты, если узнаю, как:)
РЕДАКТИРОВАТЬ: Был задан вывод: Ну, я не получаюошибка, просто описанный пустой список для "my_nodes".Я использую PyCharm 8.13.
my_nodes = {list}<class 'list'>: []
Я бы ожидал чего угодно, кроме пустого списка, поскольку запросы работают с плагином XPath.
Вот скриншот, объясняющий проблему:
запрос с плагином XPath