Может ли python делать поиск данных по разделам? - PullRequest
0 голосов
/ 02 мая 2020

Я застрял, мне интересно, может ли python сканировать часть кода HTML? Пример моего HTML кода здесь

<!DOCTYPE html>
<html>
<body>

<h3>
<a name=Run_5.1>Run# 5.1</a>
</h3>
<a href=#TOP>Back to TOP</a><p>
<br>
<TABLE WIDTH=100% BORDER=1 CELLPADDING=4 CELLSPACING=3><THEAD><TR VALIGN TOP>
<TH><p>ID</p></TH><TH><p>A</p></TH><TH><p>B</p></TH><TH><p>C</p></TH><TH><p>D</p></TH><TH><p>E</p></TH><TH><p>F</p></TH><TH><p>G</p></TH><TH><p>/p></TH><TH><p>I</p></TH><TH><p>J</p></TH><TH><p>Others</p></TH><TH><p>K</p></TH><TH><p>L</p></TH></TR></THEAD><TBODY><TR>
<TD><P>1-A1</P></TD>
<TD><P>900960640</P></TD>
<TD><P>1465010</P></TD>
<TD><P>90053312</P></TD>
<TD><P>14071333</P></TD>
<TD><P>14071333(1-A2)</P></TD>
<TD><P>0</P></TD>
<TD><P>0</P></TD>
<TD><P>0</P></TD>
<TD><P>0</P></TD>
<TD><P>0</P></TD>
<TD><P>0</P></TD>
<TD><P>0</P></TD>
<TD><P>0.0</P></TD>
</TR>
<TR>
<TD><P><B><FONT COLOR="#FF0000">1-B1</FONT></B></P></TD>
<TD><P><B><FONT COLOR="#FF0000">8799053184</FONT></B></P></TD>
<TD><P><B><FONT COLOR="#FF0000">137485206</FONT></B></P></TD>
<TD><P><B><FONT COLOR="#FF0000">8795723776</FONT></B></P></TD>
<TD><P><B><FONT COLOR="#FF0000">137433184</FONT></B></P></TD>
<TD><P><B><FONT COLOR="#FF0000">137433186(1-B2)</FONT></B></P></TD>
<TD><P><B><FONT COLOR="#FF0000">0</FONT></B></P></TD>
<TD><P><B><FONT COLOR="#FF0000">0</FONT></B></P></TD>
<TD><P><B><FONT COLOR="#FF0000">2</FONT></B></P></TD>
<TD><P><B><FONT COLOR="#FF0000">0</FONT></B></P></TD>
<TD><P><B><FONT COLOR="#FF0000">0</FONT></B></P></TD>
<TD><P><B><FONT COLOR="#FF0000">0</FONT></B></P></TD>
<TD><P><B><FONT COLOR="#FF0000">2</FONT></B></P></TD>
<TD><P><B><FONT COLOR="#FF0000"><0.0</FONT></B></P></TD>
</TR>
<TR>
<TD><P>1-A2</P></TD>
<TD><P>90632</P></TD>
<TD><P>1433</P></TD>
<TD><P>900</P></TD>
<TD><P>1610</P></TD>
<TD><P>1410(1-A1)</P></TD>
<TD><P>0</P></TD>
<TD><P>0</P></TD>
<TD><P>0</P></TD>
<TD><P>0</P></TD>
<TD><P>0</P></TD>
<TD><P>0</P></TD>
<TD><P>0</P></TD>
<TD><P>0.0</P></TD>
</TR>
</TBODY></TABLE>
<hr>

<h3>
<a name=Run_5.6>Run# 5.6</a>
</h3>
<a href=#TOP>Back to TOP</a><p>

<br>
<TABLE WIDTH=100% BORDER=1 CELLPADDING=4 CELLSPACING=3><THEAD><TR VALIGN TOP>
<TH><p>ID</p></TH><TH><p>A</p></TH><TH><p>B</p></TH><TH><p>C</p></TH><TH><p>D</p></TH><TH><p>E</p></TH><TH><p>F</p></TH><TH><p>G</p></TH><TH><p>/p></TH><TH><p>I</p></TH><TH><p>J</p></TH><TH><p>Others</p></TH><TH><p>K</p></TH><TH><p>L</p></TH></TR></THEAD><TBODY><TR>
<TD><P>1-A1</P></TD>
<TD><P>88796</P></TD>
<TD><P>13814</P></TD>
<TD><P>889344</P></TD>
<TD><P>1381</P></TD>
<TD><P>1371(1-A2)</P></TD>
<TD><P>0</P></TD>
<TD><P>0</P></TD>
<TD><P>0</P></TD>
<TD><P>0</P></TD>
<TD><P>0</P></TD>
<TD><P>0</P></TD>
<TD><P>0</P></TD>
<TD><P>0.0</P></TD>
</TR>
<TR>
<TD><P>1-A2</P></TD>
<TD><P>88644</P></TD>
<TD><P>1371</P></TD>
<TD><P>88496</P></TD>
<TD><P>1994</P></TD>
<TD><P>1314(1-A1)</P></TD>
<TD><P>0</P></TD>
<TD><P>0</P></TD>
<TD><P>0</P></TD>
<TD><P>0</P></TD>
<TD><P>0</P></TD>
<TD><P>0</P></TD>
<TD><P>0</P></TD>
<TD><P>0.0</P></TD>
</TR>
<TR>
<TD><P>1-A3</P></TD>
<TD><P>8836</P></TD>
<TD><P>1399</P></TD>
<TD><P>83476</P></TD>
<TD><P>1159</P></TD>
<TD><P>1359(1-A4)</P></TD>
<TD><P>0</P></TD>
<TD><P>0</P></TD>
<TD><P>0</P></TD>
<TD><P>0</P></TD>
<TD><P>0</P></TD>
<TD><P>0</P></TD>
<TD><P>0</P></TD>
<TD><P>0.0</P></TD>
</TR>
<TR>
<TR>
<TD><P><B><FONT COLOR="#FF0000">1-B1</FONT></B></P></TD>
<TD><P><B><FONT COLOR="#FF0000">879184</FONT></B></P></TD>
<TD><P><B><FONT COLOR="#FF0000">1375206</FONT></B></P></TD>
<TD><P><B><FONT COLOR="#FF0000">87923776</FONT></B></P></TD>
<TD><P><B><FONT COLOR="#FF0000">1373184</FONT></B></P></TD>
<TD><P><B><FONT COLOR="#FF0000">1373186(1-B2)</FONT></B></P></TD>
<TD><P><B><FONT COLOR="#FF0000">0</FONT></B></P></TD>
<TD><P><B><FONT COLOR="#FF0000">0</FONT></B></P></TD>
<TD><P><B><FONT COLOR="#FF0000">2</FONT></B></P></TD>
<TD><P><B><FONT COLOR="#FF0000">0</FONT></B></P></TD>
<TD><P><B><FONT COLOR="#FF0000">0</FONT></B></P></TD>
<TD><P><B><FONT COLOR="#FF0000">0</FONT></B></P></TD>
<TD><P><B><FONT COLOR="#FF0000">2</FONT></B></P></TD>
<TD><P><B><FONT COLOR="#FF0000"><0.0</FONT></B></P></TD>
</TR>
</TBODY></TABLE>
<hr>


</body>
</html>

Я хочу определить те красные тексты, из которых таблица заголовка

Например, может python распечатать

1 -B1 8799053184 137485206 8795723776 137433184 et c ... из прогона № 5.1

1-B1 8799053184 137485206 8795723776 137433184 et c из прогона № 5.6

from bs4 import BeautifulSoup
html_doc = """
soup = BeautifulSoup(html_do, 'html.parser')
bold_red = soup.select('b > font[color="#FF0000"]')
haha = [ each.text for each in bold_red ]
print (strhaha[Number_3])
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...