Можно ли использовать jQuery для разбора HTML? - PullRequest
0 голосов
/ 31 октября 2010

Просто из любопытства я пытаюсь выяснить, возможно ли использовать jQuery для чтения HTML-файла, чтобы я мог использовать его для вывода некоторых значений некоторых HTML-элементов?Я ищу некоторую функциональность, например, предоставляемую Firebug, т.е. Firebug позволяет мне использовать $() на любой веб-странице, поэтому я пытаюсь достичь:

  • У меня есть куча HTML-файлов
  • Мне нужно загрузить каждый из них и, используя jQuery, я хочу извлечь некоторую информацию, относящуюся к некоторым элементам HTML

Так что, возможно, используйте Python для загрузки каждого файла, а затем используйте jQuery для анализаHTML как-то.Я не знаю правильную терминологию, которую можно использовать для описания этого требования, но есть предложения?Может быть, я ищу механизм исполнения командной строки jQuery?

EDIT: Или, может быть, я ищу язык сценариев, который обеспечивает функциональность $().Я посмотрел на Beautiful Soup, но мне все еще интересно узнать о функциональности, подобной jQuery.

Ответы [ 4 ]

3 голосов
/ 31 октября 2010

Может быть, я получу другой ответ, но я только что нашел самое близкое совпадение здесь:

http://pypi.python.org/pypi/pyquery

На данный момент это выглядит потрясающе.

1 голос
/ 31 октября 2010

Если вы используете питон, то, вероятно, красивый суп - лучшее решение

http://www.crummy.com/software/BeautifulSoup/

1 голос
/ 31 октября 2010

Возможно взгляните на lxml?Подмодуль lxml.cssselect позволяет выбирать объекты способом, очень похожим на селекторы jQuery.

0 голосов
/ 31 октября 2010

Я использовал PHP: DOM довольно успешно для очистки веб-страниц.Для простого извлечения данных getElementById и getElementByTagName обычно достаточно мощные.

...