хотите извлечь номера телефонов, которые приведены в тексте без тегов - PullRequest
0 голосов
/ 24 декабря 2018

Вот мой код.Как извлечь номер мобильного телефона из данных, возвращаемых веб-страницей?

from bs4 import BeautifulSoup
import requests
r = requests.get("https://www.medindia.net/patients/doctor_search/dr-amiya-obstetrics-and-gynaecology-north-lakhimpur-assam-231775-1.htm")
soup = BeautifulSoup(r.text,'lxml')

data= soup.find('div',class_='col-xs-12')
h3 = data.find('h3')
print h3.text

p = data.find('p')

print p.text
r = data.find('span')

print r.text

1 Ответ

0 голосов
/ 24 декабря 2018

Вы можете попробовать использовать findAll ('p') вместо просто find ('p').

from bs4 import BeautifulSoup
import requests
r = requests.get("https://www.medindia.net/patients/doctor_search/dr-amiya-obstetrics-and-gynaecology-north-lakhimpur-assam-231775-1.htm")
soup = BeautifulSoup(r.text,'lxml')

data= soup.find('div',class_='col-xs-12')
h3 = data.find('h3')
print(h3.text)

p = data.findAll('p')

for pdata in p:
    print(pdata.text)

r = data.find('span')
print(r.text)

Вывод:

Dr. Amiya
ward no 12, k b road , north lakhimpur - 787001, assam

Phone : 91-3752-9435487Email : damircentre@gmail.com

damircentre@gmail.com
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...