Вот некоторые факторы, которые следует учитывать наряду с решением, которое, я думаю, лучше всего с ним справляется:
Время разработки - Администратор хранилища данных -
Чтобы использовать Bulkloader, вам нужно написать сценарии, поддерживать серверы резервного копирования, хранилище и т. Д.
Стоимость - Администратор хранилища данных -
YMMV, но наша резервная копия десятков миллионов объектов использовала <1% квоты очереди задач 1bil. Стоимость операций чтения и хранения хранилища данных будет зависеть от вашего приложения. Но между этими двумя вариантами операции чтения должны быть одинаковыми, и вы торгуете Исходящей пропускной способностью ($ 0,12 / ГБ) в Bulkloader для хранилища Blobstore ($ 0,0043 / ГБ) с администратором хранилища данных. </p>
Продолжительность резервного копирования - Администратор хранилища данных -
Как и следовало ожидать, осколки mapreduce, записывающие данные в Blobstore внутри сети Google, намного быстрее, чем потоковая передача данных сущностей по одному. Полное резервное копирование наших данных с Datastore Admin занимает менее 6 часов. С Bulkloader это занимает более 3 дней.
Резервное копирование обслуживания - Bulkloader (на данный момент) -
С помощью Bulkloader и сервера вы можете создавать кроны для регулярного резервного копирования и обслуживания резервных копий. Например, у нас есть сервер в Rackspace, который резервирует наше хранилище данных каждые 3 дня и сохраняет последние 2 резервные копии. С Datastore Admin вы должны вручную выполнять резервное копирование и удалять устаревшие резервные копии, пока не будет опубликовано автоматизированное решение ( Issue 7040 ). Тем не менее, для резервного копирования раз в месяц затраты на ручное выполнение операций с Datastore Admin настолько низки, что я рекомендую это.
Гибкость данных - Bulkloader -
С помощью массового загрузчика вы можете экспортировать все свои данные в удобные для восприятия файлы csv, что позволит вам развернуть их в Excel, создать тестовый набор данных для локальной среды разработки или даже перенести свою работу в другую службу размещения приложений (например, AWS), если вам потребуется это.
Точное восстановление - Bulkloader -
Bulkloader может обрабатывать восстановление отдельных объектов (где вы точно знаете, какие объекты вы удалили или перезаписали) и массовое восстановление. Администратор хранилища данных может выполнять массовое восстановление только для всех объектов данного вида.
Массовое восстановление - Администратор хранилища данных -
Администратор хранилища данных минимизирует очень дорогие записи, только обновляя измененные объекты. Sharding также делает этот процесс намного, намного быстрее, чем простая загрузка Bulkloader (хотя вы можете самостоятельно перерезать данные резервной копии csv для многих клиентов).
В конечном итоге Bulkloader дает вам более точное управление, а Datastore Admin упрощает и ускоряет массовое резервное копирование / восстановление. Несмотря на то, что администратор хранилища данных является новым и имеет несколько проблем ( 7076 ), учитывая вашу ситуацию, я определенно рекомендую его.