Просто возьмем случай, когда я читаю данные из базы данных с условиями (миллионы строк), занимаюсь бизнесом с данными и затем обновляю их.
Я использую разделитель диапазона столбцов (столбец Id) принятие Min и Max идентификаторов для обработки и создание разделов с max-min / gridSize.
Теперь представьте, что у меня есть идентификаторы 1, 22, 23, 24, 30 с gridSize = 3, с этим logi c у меня будет 3 раздела:
раздел1 идентификатор обработки 1
раздел2 обработка 0 строк
раздел3 обработка 22, 23, 24 и 30
При миллионах данных параллельная обработка, подобная этой, бесполезна, и попытки восстановить все данные в одном запросе для реализации распределенного разделения занимают вечность ..
Какое лучшее решение?