Так что я пишу приложение, которое будет немного скрести экран. Я использую HTML Agility Pack для загрузки всей HTML-страницы в экземпляр HtmlDocoument
, называемый doc
. Теперь я хочу проанализировать этот документ, ища это:
<table border="0" cellspacing="3">
<tr><td>First rows stuff</td></tr>
<tr>
<td>
The data I want is in here <br />
and it's seperated by these annoying <br /> 's.
No id's, classes, or even a single <p> tag. </p> Just a bunch of <br /> tags.
</td>
</tr>
</table>
Так что мне просто нужно получить данные во 2-й строке. Как я могу это сделать? Должен ли я использовать регулярное выражение или что-то еще?
Обновление: Вот как я загружаю свой doc
HtmlWeb hw = new HtmlWeb();
HtmlDocument doc = hw.Load(Url);