Привет, ребята, у меня есть часть HTML-страницы, которую мне нужно разобрать.Поэтому мне нужно имя и адрес электронной почты.
Фамилия: Адрес электронной почты:
Итак, я попробовал это:
from bs4 import BeautifulSoup
def get_page_data():
soup = BeautifulSoup(html, 'lxml')
email = soup.find(id='email')
first = soup.find(id='name.first')
data = {'first': first,
'email': email
}
return data
И это дает мне вывод:
{
name:id="name.last" name="name.last" tabindex="2" type="text" value="**Name I need**"/>
<br />
email:id="email" name="email" tabindex="0" style="background-color:#D4D0C8;" readonly="readonly" type="text" value="**Email I need**" size="30" maxlength="50"/><br />
}
Я попытался преобразовать каждый в строку и нарезать ее.Вывод был следующим: name: value = " Name Мне нужно ", email: value = " Email Мне нужно "
Но оно может не работать для других страниц.
Пробовал .next_sibling или previou_sibling, но он возвращает: нет.
И я считаю, что есть более элегантный способ решить эту проблему.Может быть, с ре или я пропустил что-то из BeautifulSoup.
Буду рад любым советам.
Заранее спасибо.