Вопросы с тегом веб-гусеничный

0 голосов

1 ответ

Stormcrawler - как работает es.status.filterQuery?

Я использую stormcrawler для помещения данных в некоторые индексы Elasticsearch, и у меня есть...

jimmat / 25 апреля 2019

0 голосов

1 ответ

Исключение в потоке "main" java.lang.ClassNotFoundException ошибка

Я бегу hadoop jar /home/apache-nutch-2.3.1/runtime/deploy/apache-nutch-2.3.1.job org.apache.nutch

user9332151 / 25 апреля 2019

0 голосов

1 ответ

Попытка получить тот же результат по элементам xpath и css

Я пытаюсь получить тот же результат с сайта, используя элементы dom и xpath. Так что я могу сделать...

Daan Kats / 25 апреля 2019

0 голосов

0 ответов

Scrapy - Неверный URL запроса

Я пытаюсь отправить запрос с использованием scrapy, используя этот код: import scrapy import json...

M. Coppée / 25 апреля 2019

0 голосов

1 ответ

ValueError: чтение закрытого файла

Я пытаюсь разобрать некоторые страницы, используя BeautifulSoup , но для некоторых ссылок...

Hadi GhahremanNezhad / 24 апреля 2019

1 голос

0 ответов

Как сделать веб-сканер с несколькими выпадающими меню на Python?

Это сайт о регистрации данных о загрязнении воздуха.Данные являются почасовыми данными за несколько...

Adam / 24 апреля 2019

1 голос

1 ответ

GitHub репозиторий не отображается в поиске Google - нет способа отправить URL

Я сделал публичное репозиторий Github неделю назад, но оно все равно не отображается в поиске...

JenyaKh / 24 апреля 2019

0 голосов

1 ответ

Скрап питон CrawlSpider не ползет

import scrapy from scrapy.spiders.crawl import CrawlSpider, Rule from scrapy.linkextractors import...

AlbertWolfgang / 24 апреля 2019

2 голосов

1 ответ

Могу ли я использовать сканированный из Node.js в javaScript?

Я новичок в javaScript и пытаюсь отсканировать сайт с помощью node.js. Я мог бы проверить данные в...

Soomin Shin / 24 апреля 2019

0 голосов

1 ответ

оболочка scrapy выглядит по-другому как пользовательский интерфейс, часть сайта не подлежит уничтожению

Проблема в том, что я не могу почистить часть сайта.Если я использую Chrome Devmode, я не могу...

蔡逸夫 / 24 апреля 2019

0 голосов

0 ответов

стратегия кеширования для поиска горячих слов

У нас есть большой сайт электронной коммерции.Наши серверы находятся под большим давлением,...

yifan / 23 апреля 2019

0 голосов

1 ответ

Невозможно получить доступ к некоторым веб-сайтам на сервисе Amazon

Описание Я сканирую веб-сайт: bjx.com , и все коды можно запускать на локальном компьютере. Затем я...

Deft-pawN / 23 апреля 2019

0 голосов

1 ответ

Beautiiful Soup Crawler останавливается в середине работы

Я пишу программу для сохранения газетных комментариев в sqlite db.Для очистки я использую красивый...

jo87casi / 22 апреля 2019

0 голосов

1 ответ

Как исправить код Python, запускаемый в vsCode, данные для сканирования искажены на китайском языке, но не в режиме ожидания Python напрямую

Я написал фрагмент веб-сканера, который использовался для сканирования словаря youdao для перевода....

liulangya / 22 апреля 2019

0 голосов

0 ответов

Переключить HTML-класс в нестандартное значение для чтения с BeautifulSoup

Я сканирую сайт с 20 результатами поиска из 200, используя запросы и BeautifulSoup. Мне нужны...

Mike / 22 апреля 2019

2 голосов

1 ответ

Как реализовать поисковый веб-сканер с широким и первым поиском?

Я пытаюсь написать веб-сканер на Python с Beautiful Soup, чтобы сканировать веб-страницу по всем...

dacoda007 / 20 апреля 2019

1 голос

2 ответов

Сканер обновляет данные в массив, возвращает внутри цикла

Я хочу непрерывно сканировать и обновлять значение массива, используя цикл, потому что мне нужно...

user3360155 / 19 апреля 2019

0 голосов

1 ответ

как исправить ОШИБКУ: ошибка обработки паука GET url

Я очищаю сайт электронной коммерции и очищаю несколько его категорий, но некоторые из них дают...

Ubbey Ecbort / 18 апреля 2019

0 голосов

1 ответ

Связь с другой стороной была потеряна

Я пытаюсь вычеркнуть все названия компаний из https://www.gpw.pl/spolki,, далее я хочу нажать...

mkc / 18 апреля 2019

0 голосов

0 ответов

Самообновляющееся Соскребание Сети

Я сейчас создаю сайт для университетского проекта (с JavaScript). Поэтому я хочу отобразить...

Josie.La / 18 апреля 2019

0 голосов

1 ответ

Вставьте №царапины с помощью Scrapy

Я хочу получить общее количество очищенного элемента и дату запуска сценария и вставить его в Mysql

Christian Read / 18 апреля 2019

0 голосов

0 ответов

Как сканировать данные о 1000 книгах одновременно с goodreads.com с помощью его API?

Я анализирую XML файлов и добавляю новое поле с именем <description> к каждому файлу со...

Rocky / 18 апреля 2019

0 голосов

0 ответов

Как использовать селеновую страницу в Scrapy?

Я занимаюсь разработкой универсального поискового робота с помощью Scrapy.Но некоторые страницы...

chanAA / 18 апреля 2019

0 голосов

2 ответов

регулярные выражения для извлечения страниц с одинаковыми URL

Я хотел бы написать регулярное выражение, которое позволит мне извлекать страницы, начинающиеся с...

kely789456123 / 18 апреля 2019

0 голосов

0 ответов

автор статьи не может сканировать внутреннюю ссылку

Я попробовал AuthorSpider в документах Scrapy, но он не возвращает мне страницу автора, он даже не...

rabbit / 17 апреля 2019