Question

Я хотел бы извлечь конкретные данные из известного URL: из HTML-тегов, таких как span, a, divs ...!
Так что я ищу существующую библиотеку для WebCrawler, написанного на C #!... или, может быть, любая другая идея.

Спасибо!

NickAldwin · Answer 1 · 27 июня 2011

Для разбора HTML вы можете захотеть взглянуть на HTML Agility Pack . Что касается получения HTML-кода с веб-сайта, вы можете использовать WebClient .

james_bond · Answer 2 · 27 июня 2011

Этот парень написал статью об использовании HtmlAgilityPack для сканирования веб-сайтов из C #, и этот является основой для веб-сканирования, хотя проект кажется мертвым, вы можете посмотреть наи посмотрите, соответствуют ли они вашим потребностям.

Программируемый WebCrawler с C #

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Программируемый WebCrawler с C #

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы