BeautifulSoup не находит текст внутри тега - PullRequest
0 голосов
/ 31 мая 2018

Это выглядит очень просто, но я не вижу ошибки, и я трачу несколько часов на это сейчас:

from bs4 import BeautifulSoup 

txt = "<HTML><BODY><TABLE><TR><TD><P>Net sales</P></TD></TR></TABLE></BODY></HTML>"
print(txt)
bs = BeautifulSoup(txt, 'html.parser')
q = bs.find(tag='p', text='Net sales')
# table = q.find_parent('table')
print("q = ", q)

Это приводит (в Jupyter) к

<HTML><BODY><TABLE><TR><TD><P>Net sales</P></TD></TR></TABLE></BODY></HTML>
q =  None

Почему текст «Чистые продажи» не найден?

Наконец, я хочу получить текст внутри табличного тега, я только что прокомментировал эту строку в коде выше.

1 Ответ

0 голосов
/ 31 мая 2018

Попробуйте без использования аргумента 'tag'

Пример:

from bs4 import BeautifulSoup

txt = "<HTML><BODY><TABLE><TR><TD><P>Net sales</P></TD></TR></TABLE></BODY></HTML>"
bs = BeautifulSoup(txt, 'html.parser')
print bs
q = bs.find('p', text='Net sales')
# table = q.find_parent('table')
print("q = ", q)

Вывод:

('q = ', <p>Net sales</p>)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...