Это звучит как массовый случай преждевременной оптимизации? Подумай о том, что ты делаешь. Вы настраиваете систему с огромным количеством движущихся частей с вероятными условиями гонки, которые сложны и сложны в обслуживании. Все это еще до того, как вы увидели данные, приведет к проблемам с производительностью.
Если вы действительно убеждены (и, может быть, у вас есть какие-то цифры, подтверждающие это), что размер данных, с которыми вы имеете дело, действительно будет обременять вашу систему. Вот шаги, которые вы должны предпринять:
- Лучшее оборудование. Аппаратное обеспечение намного дешевле, чем время разработчиков.
- Разметка
- Правильно выполненный шардинг (то, что вы предлагаете, вряд ли является правильным подходом шардинга)
Важно отметить, что 1 и 2 вместе должны (в большинстве случаев) получить доступ к таблицам с миллиардами строк.
Вы должны прочитать на: http://www.flounder.com/optimization.htm. В частности, последние строки:
Оптимизация имеет значение только тогда, когда она имеет значение. Когда это важно, это имеет большое значение, но пока вы не знаете, что это важно, не тратьте много времени на это. Даже если вы знаете, что это важно, вам нужно знать, где это важно. Без данных о производительности вы не будете знать, что оптимизировать, и, вероятно, оптимизируете не то.
Результат будет неясным, трудным для написания, трудным для отладки и трудным в обслуживании кода, который не решит вашу проблему. Таким образом, он имеет двойной недостаток: (а) увеличение затрат на разработку и обслуживание программного обеспечения и (б) отсутствие какого-либо влияния на производительность.