Мы запускаем 4 осколка по ~ 40 ГБ каждый на одном сервере. Важной вещью, о которой вам нужно позаботиться, является использование оперативной памяти, особенно в случаях с большим размером кэша. Мы выделяем около 16 ГБ для каждого шарда.
Вы ничего не сказали о скорости вашего qps (количество запросов в секунду), так как обработка высокого qps может потребовать репликации. В этом случае вы будете хранить меньше шардов на одном сервере.
Также из нашего опыта: чем меньше у вас фрагментов, тем выше производительность поиска для распределенного поиска между фрагментами, поскольку вы тратите меньше времени ЦП на слияние.