Я пытаюсь анонимизировать большой набор данных, содержащий около 600 тыс. Записей (удаление конфиденциальной информации, такой как электронная почта и т. Д.), Чтобы ее можно было использовать для некоторых тестов производительности.
Я использую Скала (Касба) с Монго.Фактический сценарий довольно прост и понятен.Когда я запускаю сценарий, весь процесс начинается довольно быстро - разбирает 1000 записей каждые 2-3 секунды, но он сильно замедляется и начинает ползти очень медленно.
Я знаю, что это довольно расплывчато, не слишком много деталейНо есть идеи, почему это происходит, и какие-либо намеки на то, как я мог бы ускорить это?