Question

Я пытаюсь проанализировать исходный код HTML с Python.Я использую BeautifulSoup для этой цели.Мне нужно получить все теги td с идентификаторами в формате nameX, где X начинается с 1. Таким образом, их name1, name2, ... столько же, сколько и у нас.

Как мне этого добиться?Мой простой код с использованием регулярных выражений не работает.

soup = BeautifulSoup(response.text,"lxml")
resp=soup.find_all("td",{"id":'name*'})

Ошибка:

IndexError: list index out of range

Andrej Shulaev · Answer 1 · 04 октября 2018

использовать лямбда + начинается с

soup.find_all('td', id=lambda x: x and x.startswith('name'))

или регулярное выражение

 soup.find_all('td', id=re.compile('^name'))

Разбор HTML для получения определенных тегов в Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Разбор HTML для получения определенных тегов в Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы