Я новичок в stackoverflow, и это мой первый вопрос.
Я пишу скрипт на Python для разбора HTML-страницы.
Страница выглядит так:
<TABLE style="border: 1px solid black">
<TR>
<TD colspan="2"><span id="text1" style="color: white">DATA1</span></TD>
</TR>
<TR>
<TD class="rowLabel" valign="top">Data name</TD>
<TD valign="top" width="100"><span id="somename1" class="alsoname">DATA2</span></TD>
</TR>
<TR>
<TD class="rowLabel" valign="top">Data name</TD>
<TD valign="top" width="100"><span id="somename2" class="alsoname">DATA3</span></TD>
</TR>
<TR>
<TD class="rowLabel" valign="top">Data name</TD>
<TD valign="top" width="100"><span id="somename3" class="alsoname">DATA4</span></TD>
</TR>
<TR>
<TD class="rowLabel" valign="top">Data name</TD>
<TD valign="top" width="100"><span id="somename4" class="alsoname">DATA5</span></TD>
</TR>
<TR>
<TD class="rowLabel" valign="top">Data name</TD>
<TD valign="top" width="100"><span id="somename5" class="alsoname">DATA6</span></TD>
</TR>
<TR>
<TD class="rowLabel" valign="top">Data name</TD>
<TD valign="top" width="100"><span id="somename6" class="alsoname">DATA7</span></TD>
</TR>
<TR>
<TD class="rowLabel" valign="top">Data name</TD>
<TD valign="top" width="100"><span id="somename7" class="alsoname">DATA8</span></TD>
</TR>
Я хотел бы собрать значения DATA из скобок на основе имени идентификатора диапазона.
Если идентификатор диапазона == somename1, поместите его значение DATA в переменную.
пока у меня есть этот код:
from HTMLParser import HTMLParser
class MyHTMLParser(HTMLParser):
def handle_starttag(self, tag, attrs):
if tag == 'span':
for name, value in attrs:
if name == 'id' and value == 'somename1':
print 'ID', value
elif name == 'id' and value == 'somename2':
print 'ID', value
elif name == 'id' and value == 'somename3':
print 'ID', value
else :
print 'NO DATA'
p = MyHTMLParser()
p.feed(flush)
Кто-нибудь может мне помочь?