Я работаю в Интернете с аннотациями pubmed.gov, и хотя я могу получить необходимые данные и распечатать их, я не могу экспортировать их в экспорт Python Pandas.По какой-то причине я получаю первый результат только при экспорте в файл Excel.Я ценю любую помощь!Итак, мой вопрос: почему я получаю только первый URL и реферат и как мне настроить свой код, чтобы получить все?Мой код показан ниже:
from bs4 import BeautifulSoup
from urllib.request import urlopen
import requests
import pandas as pd
abstracturllist = ['https://www.ncbi.nlm.nih.gov/pubmed/31098966',
'https://www.ncbi.nlm.nih.gov/pubmed/31067303',
'https://www.ncbi.nlm.nih.gov/pubmed/31045693']
for th in abstracturllist:
response = requests.get(th)
soup = BeautifulSoup(response.content, 'html.parser')
x = soup.select('div.abstr')[0].prettify()
data = {'URL':[th],'abstract':[x]}
df = pd.DataFrame(data)
df.to_excel('URLsandAbstracts.xlsx')