Я хочу пролистать, скажем, сайты других компаний, например, об автомобилях, и извлечь информацию только для чтения из моей локальной базы данных. Тогда я хочу иметь возможность отображать эту собранную информацию на моем сайте. Чисто с технологической точки зрения, есть ли уже инструмент .net, программа и т. Д., Которые достаточно универсальны для моей цели. Или я должен написать это с нуля?
Чтобы сделать это эффективно, мне может понадобиться работа WCF, которая просто добывает данные на постоянной основе и обновляет базу данных, которая затем предоставляет данные для веб-сайта.
Кроме того, есть ли способ маскировать мои звонки на эти сайты? Буду ли я создавать «нагрузку на трафик» для моих целевых сайтов? Повлияет ли это на их функциональность, если я просто безобидно сканирую их?
Как мне сделать так, чтобы мой запрос выглядел как "человек" вместо того, чтобы исходить от Кроулера?
Существуют ли примеры кода о том, как использовать библиотеку, которая анализирует дерево DOM?
Могу ли я отправить запрос на определенный сайт и получить ответ с точки зрения DOM с контролем WebBrowser?