Вопросы с тегом веб-гусеничный

0 голосов

1 ответ

c # веб-сканер

У меня есть несколько вопросов, касающихся сканеров. Могу ли я создать сканер, который работает...

Shaokan / 25 июля 2011

1 голос

1 ответ

как поисковые системы (Google, Yahoo, Bing и т. д.) относятся к дублирующимся страницам контента

Я хотел бы знать методологию, с помощью которой поисковая система обрабатывает страницы с...

Rajesh Magar / 25 июля 2011

30 голосов

4 ответов

Python: максимальная глубина рекурсии превышена при вызове объекта Python

Я создал сканер, который должен был работать примерно на 5 млн. Страниц (путем увеличения...

YSY / 25 июля 2011

0 голосов

3 ответов

Веб-паук / сканер в C # Windows.forms

Я создал веб-сканер в VC #. Сканер индексирует определенную информацию с сайтов .nl, перебивая все...

John / 23 июля 2011

9 голосов

2 ответов

Вопрос для интервью: Honeypots и веб-сканеры

Я недавно читал книгу в качестве подготовки к интервью и наткнулся на следующий вопрос: Что вы...

OckhamsRazor / 21 июля 2011

1 голос

2 ответов

Python рекурсивное сканирование для URL

У меня есть этот метод, который, когда предоставляется список ссылок, получит дочерние ссылки и так...

hackthisjay / 21 июля 2011

0 голосов

5 ответов

Используйте python для сканирования сайта

Поэтому я ищу динамичный способ сканирования веб-сайта и получения ссылок с каждой страницы.Я решил...

hackthisjay / 21 июля 2011

0 голосов

3 ответов

многоязычный сайт и поисковые системы

Я разрабатываю сайт для компании, у которой есть клиенты со всего мира, и сайт будет обслуживаться...

Sandro Antonucci / 19 июля 2011

8 голосов

2 ответов

Исключая тестируемый поддомен из сканирования поисковыми системами (с репозиторием SVN)

у меня есть: domain.com testing.domain.com Я хочу, чтобы domain.com сканировался и индексировался...

Eric / 19 июля 2011

4 голосов

2 ответов

Можно ли указать тип содержимого файла для загрузки с помощью Wget?

Я хочу использовать wget для загрузки файлов, связанных с главной страницы сайта, но я хочу только...

T. Brian Jones / 17 июля 2011

3 голосов

1 ответ

Просканируйте все ссылки на странице, защищенной паролем

Я сканирую страницу, которая требует имя пользователя и пароль для аутентификации.И я успешно...

AKIWEB / 15 июля 2011

0 голосов

2 ответов

Получение данных с веб-сайта, на котором вам необходимо войти (Java)

Я даже не знаю, возможно ли то, что я спрашиваю, и я не знаю, что искать в Google. По сути, есть...

Adam Smith / 15 июля 2011

0 голосов

1 ответ

Исключить некоторые URL из сканирования

Я пишу сканер, и в этом сканере я не хочу сканировать некоторые страницы (исключая некоторые ссылки...

arsenal / 15 июля 2011

0 голосов

1 ответ

Неверный заголовок файла cookie, а затем он запрашивает авторизацию

Я пытаюсь сканировать страницу, требующую аутентификации Siteminder, поэтому я пытаюсь передать...

arsenal / 14 июля 2011

2 голосов

3 ответов

Как я могу искать неработающие ссылки на сайте, используя Java?

Я хотел бы сканировать некоторые веб-сайты в поисках битых ссылок, желательно с использованием Java

Tom Brito / 14 июля 2011

2 голосов

3 ответов

вопрос питона / скрапа: как избежать бесконечных петель

Я использую фреймворк для поиска веб-страниц, scrapy, для сбора данных на некоторых сайтах. Я...

ProgrammingAnt / 13 июля 2011

0 голосов

2 ответов

Увеличить количество потоков в гусеничном шасси

This is the code taken from http://code.google.com/p/crawler4j/ and the name of this file is...

arsenal / 13 июля 2011

0 голосов

2 ответов

Обманывают браузер в вызове событий javascript?

Итак, я пытаюсь создать веб-паука. Я столкнулся с веб-сайтом, на котором есть некоторый javascript,...

Shahab / 13 июля 2011

0 голосов

1 ответ

Не сканировать определенную страницу по определенной ссылке (исключить определенную ссылку из сканирования)

Это код ниже в моем MyCrawler.java, и он сканирует все те ссылки, которые я предоставил в href

arsenal / 13 июля 2011

37 голосов

3 ответов

Нажмите кнопку в Scrapy

Я использую Scrapy для сканирования веб-страницы. Некоторая информация, которая мне нужна,...

naeg / 13 июля 2011

2 голосов

5 ответов

Сканирование в Интернете для определенного типа файла

В рамках исследования мне нужно как можно больше загружать свободно доступные файлы RDF (Resource...

Asanka / 13 июля 2011

1 голос

3 ответов

Поисковые системы игнорируют содержание мета-описания и показывают нижний колонтитул

У меня очень простой сайт с изображениями, формой входа и ссылкой для регистрации.Фактического...

lamp_scaler / 13 июля 2011

0 голосов

1 ответ

URL-запрос с различными прокси в Python

Я пытаюсь получить некоторые страницы, которые являются результатами поиска Google и кэшированы. На...

bahti / 12 июля 2011

2 голосов

2 ответов

Python CrawlSpider

Я изучал, как использовать scrapy, хотя у меня был минимальный опыт работы с python. Я начал...

ProgrammingAnt / 11 июля 2011

2 голосов

4 ответов

Гусеничный с Python?

Я хотел бы написать сканер, использующий python. Это значит: у меня есть URL домашней страницы...

Matteo Monti / 11 июля 2011