Проблема производительности вашего первого запроса заключается в том, что вы создали отдельные индексы для DateTime
(по убыванию) и UserId
(по возрастанию). MongoDB (как в 4.0) не может использовать пересечение индекса для сортировки результатов запроса, когда операция сортировки полностью отделена от предиката, поэтому, если это единственные доступные индексы-кандидаты, можно выбрать только один.
Примечание: хотя у вас есть два $match
этапа в исходном конвейере, сервер MongoDB объединит их в один $match
этап , который является эквивалентным запросом с использованием $and
.
Почему это медленно, только когда я хочу отсортировать его по DateTime?
Сортировка результатов в памяти считается дорогостоящей операцией, и существует предел памяти на этапе агрегирования (100 МБ) , который нельзя превысить, если вы не добавите параметр allowDiskUse
в ваша агрегация. Как и в MongoDB 4.0, планировщик запросов не имеет статистических данных о количестве элементов индекса, поэтому агрегация будет отдавать предпочтение плану индекса, поддерживающему эффективную сортировку (в вашем случае это DateTime
). Результатом вашего первого запроса будет сканирование индекса, чтобы найти все соответствующие значения DateTime
(в отсортированном порядке), а также сравнение с каждым соответствующим документом с критериями UserId
.
Во втором запросе, отсортированном по UserId
, индекс UserId
может использоваться как для сопоставления, так и для результатов сортировки. Результаты по-прежнему необходимо фильтровать для DateTime
, но критерии UserId
, вероятно, гораздо более избирательны, поэтому документов для сканирования меньше.
Идеальным индексом для поддержки обоих запросов будет составной индекс, включающий в себя DateTime
и UserId
, поддерживающие желаемый порядок сортировки. Например: db.Users.createIndex({ UserId: 1, DateTime: -1})
. Если вы добавите этот составной индекс, вы также можете удалить исходный индекс { UserId:1}
, поскольку префикс составного индекса может эффективно отвечать на те же запросы.
Самый простой способ понять производительность запроса - это explain
запрос агрегации с executionStats
. Для конвейеров агрегации этот уровень детализации требует MongoDB 3.6+; для более старых версий сервера вы можете объяснить эквивалентный запрос find()
. Ваш запрос агрегации в настоящее время не содержит этапов обработки, которые не могут быть выражены в стандартном find()
запросе.
Для получения дополнительной информации см. Использование индексов для сортировки результатов запроса в документации MongoDB. В блоге Оптимизация составных индексов MongoDB также есть некоторые полезные сведения (несмотря на использование выходных данных объяснения из более старой версии MongoDB).