Сам сервер dev, вероятно, не является отличным инструментом для очистки; он однопоточный и (по крайней мере для python; реализация java может сильно отличаться) хранилище данных довольно ужасно при хранении больших объемов данных.
Однако, в зависимости от того, что вы копируете, рабочие серверы могут не подходить для этой задачи; если для ответа на запрос сайтов может потребоваться более 10 секунд, API-интерфейс urlfetch будет отключен. Если вы можете быть уверены, что это не будет проблемой, возможно, удобнее будет выполнить очистку в производственном режиме и записать ее непосредственно в хранилище данных.
Если нет, то может иметь смысл выполнить очистку с помощью отдельного инструмента, а затем поместить данные в производственное хранилище данных либо с помощью веб-службы RESTful, либо с помощью удаленного API.
РЕДАКТИРОВАТЬ: Производственные серверы теперь могут устанавливать 10-минутный тайм-аут для urlfetches, инициируемых заданиями задач или cron, поэтому эти возражения могут больше не применяться.