В настоящее время я делаю поисковую систему для контента сайта (только для поиска на этом сайте)
GAE: +1 готов сервлет-контейнер (+ JVM6) +2 открытая поддержка openid / API -1 JPA2.0 ограничения...
привет, я написал скрипт сканирования для сканирования URL-адреса, и мне нужно выбрать 1000...
Есть ли какой-нибудь способ получить html-содержимое каждой веб-страницы во время сканирования...
Я пытаюсь запустить сканер Nutch таким образом, чтобы я мог получить доступ ко всем его функциям...
Apache Nutch 1.2 не индексирует весь сайт, только подпапки. Моя индексная страница содержит ссылки...
Я новичок в психологии Ну, сравнительно гораздо новее для Solr, чем Nutch:) Я использую Nutch в...
есть ли возможность настроить стоп-слова и синонимы в Nutch Crawler synonyms gov-->government...
Я пытаюсь разработать приложение, в котором я дам ограниченный набор URL-адресов в файл URL-адресов...
привет, я использую этот скрипт для повторного сканирования моего Nutch, но он дает исключение .....
Я использую сканер Nutch для своего приложения, которому необходимо сканировать набор URL-адресов,...
Я ищу веб-сканер с возможностью получить CSS страницы. Мне не нужны никакие другие необычные...
Я использую Apache Nutch впервые. Как я могу сохранить данные в базе данных MySQL после...
Я новичок в веб-сканировании. Я собираюсь создать поисковую систему, на которой сканер сохраняет...
Мы используем Nutch для сканирования нашего сайта в интрасети. Мы извлекаем метаданные в файле XML,...
Я занимаюсь разработкой системы, которая должна отслеживать содержимое нескольких порталов и...
привет всем Я делаю поисковую систему с шаблоном, как Google который содержит подсистему новостей,...
Мне нужно написать скрипт, который вставит 1 миллион записей с именами пользователей или...
У меня есть следующие команды, которые я собрал вместе.Он запускает Nutch и отправляет результаты в...
Как я могу скачать картинки с помощью Nutch (в Eclipse)?
Я пытаюсь запустить сканирование с использованием Nutch в Eclipse. Я использую файл с именем urls,...
Мне нужно написать сканер, чтобы извлечь некоторую информацию только из нескольких предварительно...
У меня есть веб-приложение, которое порождает скрипт, запускающий обход Nutch.Все работает очень...
Я работаю на гусеничном шасси, и мне нужно точно понять, что подразумевается под "глубиной ссылки"....
Я просканировал несколько страниц с помощью Java Nutch Также я сделал модуль с Lucene на Java,...