Вопросы с тегом SCRAPY

0 голосов

0 ответов

почему в Scrapinghub мой scrap всегда говорит мне «Превышено время ожидания TCP-соединения», но на локальной машине он работает нормально

Я получаю следующую ошибку в app.scrapinghub.com, но на моем локальном компьютере работает...

Krishna joshi / 03 мая 2018

0 голосов

1 ответ

Как запустить и сохранить состояние Scrapy из скрипта Python

В проектах scrapy мы можем получить поддержку постоянства, определив каталог заданий через...

Amit Basuri / 03 мая 2018

0 голосов

2 ответов

xpath имеет нулевое значение, которое портит списки

Я собираю имена, адреса и количество автомобилей с веб-страницы, используя код ниже. Тем не менее,...

nevster / 03 мая 2018

0 голосов

1 ответ

Django Celery Scrappy ОШИБКА: twisted.internet.error.ReactorNotRestartable

У меня есть следующая модель: Команда «собирать» (collect_positions.py) -> задача Celery (tasks.py)...

Роман Денисенко / 02 мая 2018

0 голосов

1 ответ

Ошибка при сканировании с использованием scrapy

Я использую scrapy для удаления некоторых страниц, однако всякий раз, когда я пытаюсь запустить...

codeomnitrix / 02 мая 2018

0 голосов

1 ответ

Есть ли способ включить OR / AND в CSS-селектор для веб-скребка

То, что я пытаюсь сделать, это очистить сайт, который со временем изменил свою структуру, получив...

Mr_Snuffles / 02 мая 2018

0 голосов

2 ответов

Поиск определенной строки во всем HTML, используя Beautiful Soup в Scrapy

Я хотел бы найти определенную строку на очищенной HTML-странице и выполнить некоторые действия,...

bhattraideb / 02 мая 2018

0 голосов

1 ответ

медленное сканирование, 6 блоков, 900 одновременных запросов, 10 тыс. веб-сайтов (облачное хранилище)

Я использую простой CrawlSpider, который я использую для сбора метаданных, в списке из примерно 10...

roma98 / 02 мая 2018

0 голосов

2 ответов

Scrappy - пауки застревают после выдачи запроса и функция обратного вызова не работает

Я работаю над Scrapy от 2 до 3 недель со следующими зависимостями: Python 2.7 Витая 17.9.0 Lxml 4.1

Malik Faiq / 02 мая 2018

0 голосов

1 ответ

ValueError: неподдерживаемый символ формата в трубопроводной трубе mysql

Я работаю над сканером, и эта проблема действительно беспокоит меня, так как я уже несколько дней...

meow / 02 мая 2018

0 голосов

1 ответ

При очистке веб-сайтов я получаю сообщение об ошибке «Заняло более 180 секунд». Зачем?

Пока я запускаю скрипт, scrapy постоянно выдает это сообщение: Took longer than 180.0 seconds...

Muhammad Danial / 01 мая 2018

0 голосов

1 ответ

Как импортировать модуль в PyCharm

У меня есть два проекта. Во-первых, я могу импортировать свой модуль importme.py как: import...

dorinand / 01 мая 2018

0 голосов

1 ответ

Синтаксическая ошибка Scrapy xpath при выборе нескольких классов

Я хотел бы выбрать все div с классами, состоящими из cl-list-header-title, sc-grid-col-s-12,...

dorinand / 01 мая 2018

0 голосов

2 ответов

SSL рукопожатие с использованием прокси для scrapy

Я пытаюсь настроить прокси в проекте scrapy. Я следовал инструкциям этого ответа : "1-Создайте...

Luis Ramon Ramirez Rodriguez / 01 мая 2018

0 голосов

0 ответов

Scrapy: Как я могу поменять новый прокси с промежуточным ПО, когда получу 403/302?

Я записал промежуточное ПО: def process_request(self, request, spider): request = self

Miguel A. Friginal / 01 мая 2018

0 голосов

1 ответ

scrapy экспорт данных в файлы по urls'path

Как я могу изменить код Sorce Scorce, чтобы сохранить файлы по URL, когда я экспортирую данные со...

chenshitao / 01 мая 2018

0 голосов

0 ответов

Как избежать ValueError (отсутствует URL-адрес схемы), если абсолютный URL-адрес изображения не содержит http?

Во время очистки изображений по ссылке я заметил, что URL изображений примерно такой (data: image /...

Muhammad Danial / 30 апреля 2018

0 голосов

1 ответ

Scrapy xpath соскоб мета

Я соскребаю с помощью скрапа этот URL: http://quotes.toscrape.com/ отлично работает, когда я делаю:...

eric5037 / 30 апреля 2018

0 голосов

1 ответ

методы extract_first () и extract () для селекторов scrapy, не возвращающих одно и то же значение

Использование скрапа для сбора данных с веб-страницы кинотеатра. Работа с селекторами xpath, если я...

bones.io / 30 апреля 2018

0 голосов

1 ответ

Scrapy-splash не позволяет завершить бесконечную прокрутку

Я перебираю сайт дилера подержанных автомобилей, на страницах которого есть немного javascript,...

nevster / 30 апреля 2018

0 голосов

1 ответ

Изображение баннера не может быть соскоблено

Я пытаюсь очистить ссылку на изображение баннера (увеличенное изображение) по этой ссылке:...

Deba / 29 апреля 2018

0 голосов

1 ответ

Всплеск не получает всю страницу

Сначала я запускаю splash на докере, используя: docker run -p 8050:8050 scrapinghub/splash Когда я...

P. Daimaou / 29 апреля 2018

0 голосов

1 ответ

Экспорт скрапы в разные файлы

Я читаю отзыв от Moocs это нравится one Оттуда я получаю все детали курса, 5 предметов и еще 6...

Luis Ramon Ramirez Rodriguez / 29 апреля 2018

0 голосов

1 ответ

Scrapy xpath возвращает 0 вместо фактической цены

Сайт, который я пытаюсь очистить, - https://coins.ph. Всякий раз, когда я пытаюсь извлечь из scrapy...

NaD / 29 апреля 2018

0 голосов

1 ответ

Scrapy Crawler прекращается на случайных страницах

Я новичок в Scrapy. Я сканирую субреддит r / india, используя рекурсивный парсер для хранения...

JAYESH BHATIA / 28 апреля 2018