beautifulsoup: Извлечь ВСЕ текст из поля вместо текста, завершающегося с помощью «...»? - PullRequest
0 голосов
/ 04 ноября 2019

С этой страницы я хотел бы извлечь весь текст в «Заметках», то есть:

'Ингибирование тока канала Ca2 + N-типа через GABAB в DRG крысынейроны с IC50 1,7 нМ (Callaghan et al. 2008) и 24,6 нМ в мышиной DRG мыши А9 КО (Callaghan et al. 2010). Специфический рецептор остается неясным '

Я написал это:

import requests
import pandas as pd
from bs4 import BeautifulSoup
import re
import time

for each_page in range(4,5):
    try:
        page_name = 'P' + "{:05d}".format(each_page)
        res = requests.get("http://www.conoserver.org/index.php?page=card&table=protein&id=" + str(each_page))
        soup = BeautifulSoup(res.content, 'lxml')
        final_df = pd.DataFrame()

        precursor_table = soup.find_all('table',{'class':'cardtable'})
        precursor_table_df = pd.read_html(str(precursor_table))[0].transpose()
        header =  precursor_table_df.iloc[0]
        precursor_table_df = precursor_table_df[1:]
        precursor_table_df= precursor_table_df.rename(columns = header)
        print(precursor_table_df)


    except:
        pass

Но вывод для «Заметок» прерывается:

' Ингибирование тока канала Ca2 + N-типаthro ... '

Вместо:' Ингибирование тока канала Ca2 + N-типа через GABAB в нейронах DRG крысы с IC50 1,7 нМ (Callaghan et al. 2008) и 24,6 нМ в DRG мыши измышь а9 КО (Callaghan et al. 2010). Конкретный рецептор остается неясным. '

Может кто-нибудь показать мне лучший способ вернуть полное поле Notes в виде блока текста?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...