Вопросы с тегом stormcrawler - PullRequest

Вопросы с тегом stormcrawler

0 голосов
1 ответ

Работа на СЦ 1.13. Я использую Tika Config для сканирования MS Docs и Pdf. Извлечение текста...

an__snatcher / 21 марта 2019
0 голосов
1 ответ

Итак, у нас успешно работает stormcrawler, и основной индекс в настоящее время содержит чуть более...

jimmat / 20 марта 2019
0 голосов
1 ответ

В Stormcrawler, если я добавлю -^(http|https):\/\/example.com\/page\/?date в default-regex-filters

jimmat / 20 марта 2019
2 голосов
2 ответов

У меня довольно обычная задача - иметь несколько тысяч веб-сайтов и разбирать как можно больше...

elgato / 09 марта 2019
0 голосов
1 ответ

Работа на ливневом гусеничном ходу 1.13.Я использую приведенный ниже конфиг для извлечения текста

an__snatcher / 04 марта 2019
0 голосов
1 ответ

Работа на ливневом гусеничном ходу 1.13 и упругий поиск 6.5.2.При извлечении текста я применяю тег...

an__snatcher / 06 февраля 2019
0 голосов
1 ответ

Я индексирую веб-сайт с метатегами ключевых слов, которые разделяются запятыми и точками с запятой....

ArchXZ / 30 января 2019
0 голосов
1 ответ

В моем приложении установлена ​​программа-обходчик, и она прекрасно работает, но у меня проблема...

heythere / 29 января 2019
0 голосов
2 ответов

Работа на ливневом гусеничном ходу 1.13 и эластичный поискНиже моя конфигурация гусеничного хода.Я...

an__snatcher / 24 января 2019
0 голосов
1 ответ

Работа над Storm 1.13 и Elastic Search 6.5.2.Crawler работает нормально, и у меня есть проблема с...

an__snatcher / 22 января 2019
0 голосов
1 ответ

Работая на Storm Crawler 1.13, успешно запустил сканер на веб-сайте, и одна из страниц была удалена...

an__snatcher / 17 января 2019
0 голосов
1 ответ

Работа над Storm Crawler 1.13 и Elastic Search 6.5.2. Работаем в TextExtractor. Я исключаю теги...

an__snatcher / 11 января 2019
0 голосов
1 ответ

Работа на Storm Crawler 1.13 и упругий поиск 6.5.2. Как запретить сканеру сканировать /...

an__snatcher / 08 января 2019
0 голосов
1 ответ

Работа на Storm Crawler 1.12.1 и Elastic Search 6.5.2. Мне нужно увеличить эффективность моей...

an__snatcher / 07 января 2019
0 голосов
1 ответ

Работа на Storm Crawler 1.12.1 и Elastic search 6.5.x. Мой сканер работает на http://localhost:8080...

an__snatcher / 02 января 2019
0 голосов
1 ответ

Работа на ливневом гусеничном ходу 1.10 и ES 6.4.2.После завершения процесса сканирования, когда я...

an__snatcher / 03 декабря 2018
0 голосов
1 ответ

Я использую stormcrawler, и мне интересно, есть ли возможность ограничить количество ссылок,...

cacute / 30 ноября 2018
0 голосов
1 ответ

Когда Stormcrawler выбирает веб-сайт, он применяет настроенный XPathFilter к представлению HTML,...

s_f / 29 ноября 2018
0 голосов
1 ответ

Когда я проверяю источник StormCrawler, есть много полезных журналов отладки.Но если поместить...

uiroshan / 23 ноября 2018
0 голосов
1 ответ

Работа на ES 6.5.x и штормовой гусеничной машине 1.10.Как я могу ускорить сканер, чтобы получить...

an__snatcher / 21 ноября 2018
0 голосов
1 ответ

Работа на Storm Crawler 1.10 и Apache storm 1.2.2.Как я могу изменить рабочие потоки и число, пока...

an__snatcher / 21 ноября 2018
0 голосов
1 ответ

Работал на Storm Crawler 1.11 и Elastic Search 6.5.x и пытался применить fastfilterfilter . Первый...

an__snatcher / 17 ноября 2018
0 голосов
1 ответ

Я работаю над Storm Crawler 1.10 и ES 6.4.2. Я вставил пару URL-адресов в файл seed, и я хочу...

an__snatcher / 07 ноября 2018
0 голосов
1 ответ

Storm Crawler работает в кластере Kubernetes, и мы получаем много ошибок StackOverFlow в...

cacute / 31 октября 2018
0 голосов
1 ответ

Я работаю над StormCrawler 1.10, архетипом 1.11 и Elastic Search 6.4.x. Сколько сканеров может...

an__snatcher / 30 октября 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...