Предыстория: у меня довольно большой опыт работы с Python, но в целом Noob с BeautifulSoup
Я пытаюсь получить 3 значения из одного класса. Страница, с которой я работаю, имеет ряд элементов, которые выглядят следующим образом:
<blockquote>
<a name="title"><p><B>Title</b> <table frame="hsides" border="1" cellspacing="0" cellpadding="2" bordercolor="darkblue"><tr><td><font face="arial" size="2" color="#0000CC"><b><I>Subtitle</I>: Top Text.</b></font></td></tr></table> Body Text.
<a name="title2".... etc
</blockquote>
В настоящее время я просто выгружаю весь текст в список следующим образом:
page_html = soup(page, 'html.parser')
text = []
for a in page_html.select('a'):
text.append(a.text)
И это возвращает результат, в котором каждая строка выглядит следующим образом:
Title Subtitle: Top Text. Body Text.
Что мне действительно нужно, так это возможность разбирать каждый a
в строку в кадре данных, который выглядит примерно так:
col1 col2 col3
Title Subtitle: Top Text. Body Text.
Но, честно говоря, я немного над головой.
Спасибо