Скажите, что я очищаю www.website.com. Используя эти две строки кодов,
page = requests.get(www.website.com)
tree = html.fromstring(page.content)
Я сохранил весь источник в tree
. Теперь tree
явно полон текстов и тегов и html. Меня интересует только одна конкретная строка, которая находится между двумя другими строками, скажем start
и end
, и НЕ включает в себя одну спецификацию c word
. Как я могу это сделать?