Программируемый WebCrawler с C # - PullRequest
0 голосов
/ 27 июня 2011

Я хотел бы извлечь конкретные данные из известного URL: из HTML-тегов, таких как span, a, divs ...!
Так что я ищу существующую библиотеку для WebCrawler, написанного на C #!... или, может быть, любая другая идея.

Спасибо!

Ответы [ 3 ]

2 голосов
/ 27 июня 2011

Для разбора HTML вы можете захотеть взглянуть на HTML Agility Pack . Что касается получения HTML-кода с веб-сайта, вы можете использовать WebClient .

0 голосов
/ 27 июня 2011

Многие люди на SO любят HtmlAgilityPack .

0 голосов
/ 27 июня 2011

Этот парень написал статью об использовании HtmlAgilityPack для сканирования веб-сайтов из C #, и этот является основой для веб-сканирования, хотя проект кажется мертвым, вы можете посмотреть наи посмотрите, соответствуют ли они вашим потребностям.

...