Я пишу скрипт greasemonkey, который анализирует страницу со следующей общей структурой:
<table>
<tr><td><center>
<b><a href="show.php?who=IDNumber">(Account Name)</a></b>
(#IDNumber)
<br> (Rank)
<br> (Title)
<p>
<b>Statistics:</b>
<br>
<table>
<tr><td>blah blah etc.
</td></tr></table></center></table>
Я специально пытаюсь извлечь часть (название) из этого. Однако, как вы можете видеть, он выделяется только тегом <BR>
, не имеет собственного идентификатора, является лишь частью текста тега <CENTER>
, и этот тег имеет целый ряд другого текста, связанного это.
Сейчас я пытаюсь получить innerHTML тега Center и использовать регулярное выражение для соответствия /<br>([A-Za-z ]*)<p><b>Statistics/
. Это работает хорошо для меня, но кажется, что должен быть лучший способ выбрать этот конкретный текст.
... Итак, есть ли лучший способ? Или я должен жаловаться программисту сайта, что он должен сделать этот текст более доступным? : -)