Как извлечь конкретную строку в HTML-файл из Python? - PullRequest
0 голосов
/ 17 мая 2018

Я хочу извлечь определенную красную строку элемента из файлов HTML (10 файлов). Например, у меня есть код в HTML-файле:

Function A()
{
if ---- "Which is red color"
    {
        Print "Hello" 
    }
else-if
    {
        print "World"
    }
 } "End of function A"

Function B ()
{
    if
    {
        Print "Hello" 
    }
    else-if  ---- "Which is red color"
    {
        print "World"
    }
} "End of function B"'

HTML формат как:

<html>
<!-- This file was generated by ApiDoc++ 2.0 -->
<!-- please do not modify this file -->
<head><meta content="text/html; charset=utf-8" http-equiv="content-type"/><title>Sample.html</title></head>
<body>
<br/>
Function <font color="#00A500"> A </font><br/>
<font color="#00A500">{</font><br/>
<br/>
<font color="#FF311D"><u>if</u></font>
<font color="#00A500">{</font><br/>
<font color="#00A500">Print Hello;</font><br/>
!
!
!
!

Так далее ...

Выход Нужно как:

Funct A - if
Funct B - else-if

Я написал программу на Python:

def searchhtml(data):
    soup = BeautifulSoup(data, 'html.parser')
    for ran in soup.findAll('font', {'color':'#FF311D'}) :
    print ran.text

if __name__=='__main__':
    page = urllib.urlopen('Sample.html').read()
    searchhtml(page)

Проблема в следующем: Я получаю вывод как:

if

else-if

Но мне нужно, как

Function A - if

Function B - else-if

Пожалуйста, помогите мне получить правильный выходной формат.

...