Модуль запросов Python форматирование текста - PullRequest
0 голосов
/ 13 июля 2020

Я получаю ответ, который выглядит как <a href='Link'>Data<\a> с использованием модуля запросов в python (.text). Могу ли я теперь сохранить «Данные» в переменной?

Ответы [ 2 ]

0 голосов
/ 13 июля 2020

Я бы рекомендовал Beautifulsoup для синтаксического анализа текста.

Обычно это намного больше, чем один тег a. Вы можете перечислить их все с помощью select (), а затем просмотреть их с помощью l oop. запросы на импорт из bs4 import BeautifulSoup

r = requests.get(url)

soup = BeautifulSoup(r.text, 'lxml')
atags = soup.select('a')
for text in atags:
    linktext = text.text
    # Do something with the text

Но если это всего лишь один тег a, вы можете запускать запросы импорта select_one из bs4 import BeautifulSoup

r = requests.get(url)

soup = BeautifulSoup(r.text, 'lxml')
atag = soup.select_one('a')
text  = atag.text
# Do something with the text
0 голосов
/ 13 июля 2020

да, вы ищете что-то вроде этого пакета: html2text пакет, который извлекает текст из кода HTML, полученного вами из вашего запроса.

Например:

print(html2text.html2text("<a href='Link'>Data<\a>"))

, который напечатает:

Data

...