Я работаю над веб-приложением Python, которому необходимо регулярно импортировать большие (с точки зрения ограничений GAE) сжатые файлы со стороннего сайта.Подумайте об экспорте в rdf. Проект DMOZ производится с регулярными интервалами.
Это означает ежедневную выборку gzip-файла объемом 500 МБ, распаковку, анализ, обработку и сохранение результатов в хранилище данных GAE для последующего использования.
Как правильно реализовать эту функцию в GAE, учитывая ограничения на максимальную загрузку, время обработки и т. Д.?