Извлекайте локализуемый контент со страницы HTML - PullRequest
0 голосов
/ 17 августа 2011

Мне нужен совет относительно лучшего подхода к функции, которую мне нужно реализовать в проекте, над которым я работаю.

По сути, мне нужно иметь возможность извлекать весь локализуемый контент (т.е. все строки) со страницы HTML.Я действительно не хочу идти и писать анализатор HTML.Приложение написано на C #.

Кто-нибудь имел опыт работы с этим, или кто-нибудь может порекомендовать существующую библиотеку, которую я мог бы использовать для достижения этой цели?

Спасибо.

1 Ответ

1 голос
/ 17 августа 2011

Вам не нужно писать свой собственный парсер. К счастью, это уже сделал кто-то другой.
Для анализа HTML-файла вы можете использовать HTML Agility Pack .

В этом случае вы получите объектную модель документа, по которой вы можете ходить, как и любой другой DOM. Пожалуйста, найдите эти примеры:

http://www.4guysfromrolla.com/articles/011211-1.aspx
http://htmlagilitypack.codeplex.com/wikipage?title=Examples&referringTitle=Home

И этот вопрос:

Как использовать пакет Agility HTML

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...