Я загружаю данные в кластер BigTable (в настоящее время это экземпляр разработчика). Я использую клиент c ++ для размещения данных и вижу две разные схемы загрузки:
- Выполняем одну однорядную мутацию за раз, используя метод Apply класса Table
- Выполняем несколькомутации во времени с использованием метода BulkApply класса Table
Я ожидаю, что # 2 будет более эффективным, по крайней мере, с точки зрения использования сети, но я не знаю, есть ли какие-то другие оптимизациисторона BigTable, которая позволила бы улучшить производительность (например, лучшее сжатие, меньше нагрузка на процессор / ввод-вывод) по сравнению с вариантом № 1.
Определенно, вопрос заключается в следующем: стоит ли усложнять клиент BigTable для выполнениямассовые мутации или я должен немедленно запустить каждую мутацию и забыть о какой-либо другой оптимизации на стороне клиента?