C # web и ftp crawler library - PullRequest
       0

C # web и ftp crawler library

3 голосов
/ 18 октября 2010

Мне нужна библиотека (надеюсь, в C #!), Которая работает как веб-сканер для доступа к файлам HTTP и FTP. В принципе, я доволен чтением HTML, хочу расширить его до PDF, WORD и т. Д.

Я доволен программным обеспечением для начинающих с открытым исходным кодом или, по крайней мере, любыми указаниями для документации.

Ответы [ 2 ]

4 голосов
/ 18 октября 2010

Проверка NCrawler проект

Простой и очень эффективный многопоточный веб-сканер с конвейерной обработкой, написанный на C #. Содержит обработчики документов HTML, Text, PDF и IFilter и определение языка (Google). Легко добавлять шаги конвейера для извлечения, использования и изменения информации.

1 голос
/ 28 декабря 2013

Я разработал Crawler Engine в Crawler-Lib Framework. Это сканер с поддержкой рабочих процессов, который может быть легко расширен для выполнения любых запросов или даже обработки, которую вы хотите иметь.

Вот двигатель: http://www.crawler -lib.net / гусеничный Пб двигатель

Вот несколько видео с Youtube, показывающих, как работает движок Crawler-Lib: http://www.youtube.com/user/CrawlerLib

Я знаю, что этот проект не с открытым исходным кодом, но есть бесплатная версия.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...