Содержание скребков и джанго - PullRequest
1 голос
/ 30 июня 2011

У меня есть приложение, созданное с помощью Django.Часть этого опирается на данные, которые я собираю с других сайтов.Интересно, как мне подходить к созданию скребка / агрегатора.

Преимущества его создания в качестве приложения Django:

  1. возможность использования API моделей и баз данных Django
  2. возможность использовать другие методы Джанго

С другой стороны, я думаю, что недостатком будет масштабируемость в долгосрочной перспективе.

Должен ли я построить скребок /агрегатор как приложение в моем проекте Django или как отдельный скрипт, который запускается сам по себе?

Хотелось бы услышать ваши мысли.

Ответы [ 3 ]

4 голосов
/ 30 июня 2011

Ни один из ваших пунктов не требует, чтобы он запускал в Django . А поскольку он не будет зависеть от веб / HTTP-интерфейса, единственное, что имеет смысл - иметь отдельный модуль.

3 голосов
/ 17 декабря 2011

Я только что опубликовал приложение Django django-dynamic-scraper на GitHub , которое построено на основе фреймворка Scrapy и где вы можете создавать скребки Scrapy в Django.Администратор и использовать классы моделей Django для хранения ваших данных, возможно, они пригодятся людям с похожими проблемами.

0 голосов
/ 30 июня 2011

Если это приложение django, оно будет работать только тогда, когда кто-то загрузит страницу. Это может замедлить загрузку.

Создание другого сценария может быть более приятной идеей, но может привести к неточным данным.

Я думаю, что на самом деле это зависит от контекста.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...