найти очень конкретный тег c в супе - PullRequest
0 голосов
/ 16 января 2020

Я использую BS4 и у меня есть "суп":

 <TABLE CLASS=MAINBODY WIDTH=100% CELLSPACING=0 CELLPADDING=4 BORDER=1 BORDERCOLOR=#000000><TR><TD>
    <TABLE CLASS=OBJECTNAME WIDTH=100% CELLSPACING=0 CELLPADDING=1><TR><TD WIDTH=44><IMG SRC="foobar.img"></TD><TD>Foobar text</TD></TR></TABLE>
    <!--========== SECTION: FOOBAR DETAILS ==========-->
    <TABLE CLASS=OBJECTNAME HEIGHT=25><TR><TD>Foobar text</TD></TD></TABLE>
    <!--foobar text-->

, и я хочу найти тег:

    <TABLE CLASS=OBJECTNAME WIDTH=100% CELLSPACING=0 CELLPADDING=1><TR><TD WIDTH=44><IMG SRC="foobar.img"></TD><TD>Foobar text</TD></TR></TABLE>

У меня есть список со строкой:

 <TD>Foobar text</TD>

в нем, который я использую для поиска.

Как найти тег Speci c без получения второго тега с тем же значением или получить комментарий с тем же текстом

1 Ответ

0 голосов
/ 16 января 2020

после того, как я заснул на нём и указал комментарии в лучшем направлении, я нашел ответ:

, предполагая, что список строк тегов, таких как ['<td>foobart text<\td>','<td>foo text<\td>',''<td>bar text<\td>'] с именем TagList, мой ввод здесь что я придумал:

TagList = ['<td>foobart text<\td>','<td>foo text<\td>',''<td>bar text<\td>']
for i in TagList:
        parentTable = soup.find('td', string=BeautifulSoup(i).text).find_parent('table')
        print(parentTable)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...