Я не могу сейчас найти ссылку, но формат базы данных таков, что не должно иметь значения, большой или маленький документ.Для доступа через индекс нет разницы, для сканирования таблицы неинтересные документы (или неинтересные части документов) можно быстро пропустить благодаря формату BSON.Во всяком случае, накладные расходы формата BSON влияют на крошечные документы больше, чем на большие .
Так что я бы предположил, что снижение производительности, которое вы видите, в значительной степени связано с затратами на сериализацию загрузки этих документов(конечно, для записи большого документа на диск требуется больше времени, чем для маленького документа, но он должен быть примерно одинаковым для нескольких небольших документов одинакового совокупного размера).
В своем тесте вы можете нормализоватьчисла, основанные на одном и том же объеме данных (в байтах, а не в количестве документов)?