Что касается конкретно проблемы с NLTK, мое решение, вероятно, заключалось бы в том, чтобы исправить странный импорт, который делает NLTK, и использовать его, как первоначально планировалось. Когда вы закончите, отправьте патч, конечно.
Тем не менее, если это в конечном итоге связано с прикосновением к хранилищу данных, ответ заключается в том, что это, вероятно, не может быть выполнено быстрым способом, если только ваш набор данных не мал или по какой-то причине ваши материалы по НЛП не должны поражать какой-то полнотекстовый индекс. GAE парни работают над этим , но они указали, что никто не должен ожидать быстрого решения этой конкретной проблемы.