Итак, я пытаюсь очистить все цитаты в формате AMA из результатов поиска PubMed из каждой статьи. Следующий код предназначен только для получения данных цитирования из первой статьи.
import requests
import xlsxwriter
from bs4 import BeautifulSoup
URL = 'https://pubmed.ncbi.nlm.nih.gov/?term=infant+formula&size=200'
response = requests.get(URL)
html_soup = BeautifulSoup(response.text, 'html5lib')
article_containers = html_soup.find_all('article', class_ = 'labs-full-docsum')
first_article = article_containers[0]
citation_text = first_article.find('div', class_ = 'docsum-wrap').find('div', class_ = 'result-actions-bar').div.div.find('div', class_ = 'content').div.div.text
print(citation_text)
Сценарий возвращает пустую строку, хотя, когда я проверяю источник через Google Chrome, текст отчетливо виден внутри этого «div».
Это как-то связано с JavaScript, и если да, то как мне это исправить?