Я хочу скрести текст со страниц вроде этого: https://www.ncbi.nlm.nih.gov/protein/p22217 в строку. В частности, блок текста в DBSOURCE
Мне кажется, несколько предложений по использованию soup.findall (text = true) и тому подобное, но это ничего не дает. Все, что было до 2018 года или около того, также кажется устаревшим (я использую Python 3.7). Я думаю, что проблема в том, что контент, который я хочу, находится вне диапазона r.text и r.content;когда я ищу ctrl F, искомой части просто нет.
from bs4 import BeautifulSoup
import requests
url = "https://www.ncbi.nlm.nih.gov/protein/P22217"
r = requests.get(url)
data = r.content
soup = BeautifulSoup(data, "html.parser")
PageInfo = soup.find("pre", attrs={"class":"genbank"})
print(PageInfo)
Результатом этой и других попыток является «Нет». Нет сообщения об ошибке, просто ничего не возвращается.