Получить содержимое Div с регулярными выражениями в C # - PullRequest
1 голос
/ 04 февраля 2011

У меня есть этот HTML-код:

<div id="top" style="something i dont know">
Text
</div>

И я хочу получить только строку «Текст».Мой сценарий выглядит так:

Regex search_string = new Regex("<div id=\"top\".*?>([^<]+)</div>");
Match match = search_string.Match(code);
string section = match.Groups[0].Value;
MessageBox.Show(section);

Возможно ли это даже с C #?

Ответы [ 2 ]

0 голосов
/ 04 февраля 2011

Вам лучше использовать XPath, как упоминалось ранее.Чтобы иметь возможность работать с HTML как с XML, вы можете использовать HTML Agility Pack , который очень полезен для таких задач, как ваша.

0 голосов
/ 04 февраля 2011

использовать XPath намного проще

http://www.codeproject.com/KB/cpp/myXPath.aspx

использовать это как селектор xpath

//div[@id='top']

тогда вы можете получить внутреннее значение

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...