Хранение скрапа данных в Scrapy - PullRequest
1 голос
/ 19 декабря 2011

Как мне сохранить все очищенные данные в файле?Например: данные очищены [u\ 7564.2021], но сохраненные данные в файле JSON только [

Где это идет не так?

1 Ответ

2 голосов
/ 18 марта 2012

Я нашел эту ветку, потому что у меня возникла именно эта проблема с использованием опции экспорта командной строки scrapy (нашел это в scrapy 0.15.1 Обзор: http://readthedocs.org/docs/scrapy/en/latest/intro/overview.html?highlight=Rule#run-the-spider-to-extract-the-data), "scrapy crawl mininova.org -o scraped_data.json -t json".

Сначала вы должны убедиться, что данные действительно удаляются с сайта (я сделал это, распечатав свои очищенные элементы прямо в окне консоли).

Также убедитесь, что ваш паук анализируетМетод на самом деле возвращает очищенный элемент. Это была глупая ошибка, которую я допустил.

Без дополнительной информации или вашего кода трудно сказать больше. Я новичок в Python и сам пишу, и работаю через иногда запутаннуюдокументы и примеры. Надеюсь, вы не отказались от этого проекта в последние пару месяцев, в противном случае я буду публиковать сообщения для будущих гуглеров.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...