StringTokenizer st = new StringTokenizer(remaining, "\t\n\r\"'>#"); String...
Я пытаюсь получить данные с различных веб-сайтов. После поиска в переполнении стека я использую...
Я пытаюсь извлечь конкретный контент в HTML с помощью Jsoup.Ниже приведен пример содержимого html....
У меня есть список ключевых слов.С помощью Mozmill я хотел бы получить первый URL-адрес результата...
Я использую Mechanize для получения данных со многих веб-сайтов. Когда я попытался войти на сайт...
У меня есть вопрос новичка: я хотел бы написать сканер (~ 1000 веб-страниц) с MozMill, но слишком...
Я хочу создать приложение, которое будет входить на веб-сайт и извлекать исходный код HTML с...
В моем аккаунте Google для веб-мастеров Google показывает, что у меня возникают ошибки сканирования...
Я просканировал некоторые данные с помощью Nutch и сумел внедрить их в эластичный поиск.Но у меня...
Я заметил, что использование urllib для загрузки веб-страницы: http://www.amazon.co
Я использую scrapy для сканирования всех веб-страниц в домене. Я видел этот вопрос. Но нет решения....
Я начал узнавать о веб-сканерах недавно и создал образец сканера с Ruby, Anemone и Mongodb для...
У меня есть таблица таких ссылок <a href="dealerships/<?php echo...
У меня есть старый инструмент, который (бывший) коллега написал несколько лет назад с Jaxer,...
Я работаю над приложением ROR, где мне нужно реализовать сканер, который сканирует другие сайты и...
Я пытаюсь разработать музыкальную поисковую систему для моего проекта последнего года. Я проводил...
Для одного из моих проектов статистики мне нужно СЛУЧАЙНО загрузить несколько файлов со страницы...
Я только что изменил настройки DNS, поэтому папка /forum теперь является поддоменом, а не...
Я пишу сканер для сканирования изображений, который должен программно щелкнуть меню, чтобы перейти...
NCrawler не сканирует после первого URL, даже если MaxCrawlDepth> 1. Поэтому, если я укажу yahoo
Я создал телефонную книгу Java (настольное приложение), на моем компьютере есть программа, которая...
Я сканирую сайт, который может содержать много start_urls, например: http://www.a.com/list_1_2_3
Мне нужно войти на домашнюю страницу, но я хочу, чтобы моя программа это делала, или когда я вошел...
Я довольно новичок в веб-разработке и никогда раньше не делал ни скрепки экрана, ни...
Я использую Анемон. Как мне сканировать субдомен тоже? например, если у меня есть веб-сайт www.abc