Начните с набора реплик из 2 узлов и посмотрите, не дает ли Mongo лучшую скорость вставки / обновления. Если запись будет быстрее (что может быть), тогда вы сможете справиться с большей нагрузкой. Обработка большей нагрузки вполне может быть всем, что вам нужно с точки зрения повышения производительности.
Единственная причина, по которой необходимо для шардинга на сервере , заключается в том, что вам нужно как-то увеличить количество операций записи, и вы еще не исчерпали свой IO (это довольно редко).
Я бы предложил начать с перехода к наборам реплик Монго (ведущий / ведомый поддерживается, но "менее хорошо").