Как найти указанную строку c на веб-странице, которая находится между двумя конкретными строками, используя python? - PullRequest
0 голосов
/ 11 марта 2020

Скажите, что я очищаю www.website.com. Используя эти две строки кодов,

page = requests.get(www.website.com)
tree = html.fromstring(page.content)

Я сохранил весь источник в tree. Теперь tree явно полон текстов и тегов и html. Меня интересует только одна конкретная строка, которая находится между двумя другими строками, скажем start и end, и НЕ включает в себя одну спецификацию c word. Как я могу это сделать?

Ответы [ 2 ]

0 голосов
/ 11 марта 2020

Как насчет этого:

>>> tree = "This is the start and end"
>>> tree.split('start')[-1].split('end')[0]
' and '

0 голосов
/ 11 марта 2020

Не зная специфического формата c веб-сайта, который вы просматриваете, я могу думать только о том, чтобы выполнить конкатенацию в глубину содержимого элементов html в дереве. Затем найдите в этой конкатенации «начало», запишите этот индекс, найдите «конец», запишите этот индекс, а затем возьмите подстроку между двумя индексами.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...