Разбор HTML для получения определенных тегов в Python - PullRequest
0 голосов
/ 04 октября 2018

Я пытаюсь проанализировать исходный код HTML с Python.Я использую BeautifulSoup для этой цели.Мне нужно получить все теги td с идентификаторами в формате nameX, где X начинается с 1. Таким образом, их name1, name2, ... столько же, сколько и у нас.

Как мне этого добиться?Мой простой код с использованием регулярных выражений не работает.

soup = BeautifulSoup(response.text,"lxml")
resp=soup.find_all("td",{"id":'name*'})

Ошибка:

IndexError: list index out of range

1 Ответ

0 голосов
/ 04 октября 2018

использовать лямбда + начинается с

soup.find_all('td', id=lambda x: x and x.startswith('name'))

или регулярное выражение

 soup.find_all('td', id=re.compile('^name'))
...