Использование jQuery на стороне сервера для очистки HTML-страниц - PullRequest
1 голос
/ 07 августа 2011

Я уверен, что об этом спрашивали миллиард с половиной раз, но я искал и ничего не нашел на нем.

Я хотел бы динамически очистить некоторые html-страницы и загрузитьрезультаты в мою базу данных.jQuery кажется идеальной библиотекой для этого, но, конечно, она работает в браузере, и я собираюсь сделать это без взаимодействия браузера и пользователя.

Что было бы рекомендовано для выполнения этого на сервере -сторона (C # в моем случае)?Regex кажется излишним и не обязательно подходит для этой задачи.

Спасибо, -Ben

ОБНОВЛЕНИЕ:

Эта библиотека похожа на то, что я ищу ... но человекМне очень нравится, как работает jQuery.

http://htmlagilitypack.codeplex.com/

1 Ответ

4 голосов
/ 07 августа 2011

jQuery кажется идеальной библиотекой для этого

Я не уверен в этом. та же политика происхождения ограничит вас очисткой страниц только в том же домене, что и тот, который обслуживал javascript (который в основном ограничивает вас вашим собственным доменом и веб-очисткой, которая довольно ограничена). Для этой задачи было бы лучше использовать язык на стороне сервера и библиотеку разбора HTML. В зависимости от используемого языка серверной стороны могут быть доступны разные библиотеки. Html Agility Pack очень хорошо, если вы используете .NET на сервере. Но что бы вы ни делали и какое бы решение вы ни выбрали, одно точно: не используйте регулярные выражения для анализа HTML.

...