Я хочу извлечь определенную красную строку элемента из файлов HTML (10 файлов).
Например, у меня есть код в HTML-файле:
Function A()
{
if ---- "Which is red color"
{
Print "Hello"
}
else-if
{
print "World"
}
} "End of function A"
Function B ()
{
if
{
Print "Hello"
}
else-if ---- "Which is red color"
{
print "World"
}
} "End of function B"'
HTML формат как:
<html>
<!-- This file was generated by ApiDoc++ 2.0 -->
<!-- please do not modify this file -->
<head><meta content="text/html; charset=utf-8" http-equiv="content-type"/><title>Sample.html</title></head>
<body>
<br/>
Function <font color="#00A500"> A </font><br/>
<font color="#00A500">{</font><br/>
<br/>
<font color="#FF311D"><u>if</u></font>
<font color="#00A500">{</font><br/>
<font color="#00A500">Print Hello;</font><br/>
!
!
!
!
Так далее ...
Выход Нужно как:
Funct A - if
Funct B - else-if
Я написал программу на Python:
def searchhtml(data):
soup = BeautifulSoup(data, 'html.parser')
for ran in soup.findAll('font', {'color':'#FF311D'}) :
print ran.text
if __name__=='__main__':
page = urllib.urlopen('Sample.html').read()
searchhtml(page)
Проблема в следующем:
Я получаю вывод как:
if
else-if
Но мне нужно, как
Function A - if
Function B - else-if
Пожалуйста, помогите мне получить правильный выходной формат.