оптимизация производительности запросов mongoldb - PullRequest
1 голос
/ 24 марта 2020

В моей коллекции store есть следующая структура документа,

{
  "_id": "some_custom_id",
  "inventory": [
    {
      "productId": "some_prod_id",
      // ...restAttributes
    },
    // 500+ such items
  ]
}

Я пытаюсь сделать запрос coll.find({_id:"some_id","inventory.productId":"some_prod_id"},{...})

Запрос иногда занимает много времени вернуться (10 секунд или около того). поэтому я создал индекс {_id:1,"inventory.productId":1}, но все еще без увеличения производительности, поэтому я попробовал mon go query объяснение и обнаружил, что используется индекс _id, а не тот, который я создал. Затем я создал еще один индекс {"inventory.productId":1, _id:1}, все еще не повезло.

Вот вывод coll.find({_id:"some_id","inventory.productId":"some_prod_id"}).explain("executionStats")

{
    "queryPlanner" : {
        "plannerVersion" : 1,
        "namespace" : "somedb.Stores",
        "indexFilterSet" : false,
        "parsedQuery" : {
            "$and" : [ 
                {
                    "_id" : {
                        "$eq" : "114"
                    }
                }, 
                {
                    "inventory.productId" : {
                        "$eq" : "41529689"
                    }
                }
            ]
        },
        "winningPlan" : {
            "stage" : "FETCH",
            "filter" : {
                "inventory.productId" : {
                    "$eq" : "41529689"
                }
            },
            "inputStage" : {
                "stage" : "IXSCAN",
                "keyPattern" : {
                    "_id" : 1
                },
                "indexName" : "_id_",
                "isMultiKey" : false,
                "multiKeyPaths" : {
                    "_id" : []
                },
                "isUnique" : true,
                "isSparse" : false,
                "isPartial" : false,
                "indexVersion" : 2,
                "direction" : "forward",
                "indexBounds" : {
                    "_id" : [ 
                        "[\"114\", \"114\"]"
                    ]
                }
            }
        },
        "rejectedPlans" : []
    },
    "executionStats" : {
        "executionSuccess" : true,
        "nReturned" : 1,
        "executionTimeMillis" : 0,
        "totalKeysExamined" : 1,
        "totalDocsExamined" : 1,
        "executionStages" : {
            "stage" : "FETCH",
            "filter" : {
                "inventory.productId" : {
                    "$eq" : "41529689"
                }
            },
            "nReturned" : 1,
            "executionTimeMillisEstimate" : 0,
            "works" : 2,
            "advanced" : 1,
            "needTime" : 0,
            "needYield" : 0,
            "saveState" : 0,
            "restoreState" : 0,
            "isEOF" : 1,
            "invalidates" : 0,
            "docsExamined" : 1,
            "alreadyHasObj" : 0,
            "inputStage" : {
                "stage" : "IXSCAN",
                "nReturned" : 1,
                "executionTimeMillisEstimate" : 0,
                "works" : 2,
                "advanced" : 1,
                "needTime" : 0,
                "needYield" : 0,
                "saveState" : 0,
                "restoreState" : 0,
                "isEOF" : 1,
                "invalidates" : 0,
                "keyPattern" : {
                    "_id" : 1
                },
                "indexName" : "_id_",
                "isMultiKey" : false,
                "multiKeyPaths" : {
                    "_id" : []
                },
                "isUnique" : true,
                "isSparse" : false,
                "isPartial" : false,
                "indexVersion" : 2,
                "direction" : "forward",
                "indexBounds" : {
                    "_id" : [ 
                        "[\"114\", \"114\"]"
                    ]
                },
                "keysExamined" : 1,
                "seeks" : 1,
                "dupsTested" : 0,
                "dupsDropped" : 0,
                "seenInvalidated" : 0
            }
        }
    },
    "serverInfo" : {
        "host" : "somecluster-shard-00-02-1jury.gcp.mongodb.net",
        "port" : 27017,
        "version" : "4.0.16",
        "gitVersion" : "2a5433168a53044cb6b4fa8083e4cfd7ba142221"
    },
    "ok" : 1.0,
    "operationTime" : Timestamp(1585112231, 1),
    "$clusterTime" : {
        "clusterTime" : Timestamp(1585112231, 1),
        "signature" : {
            "hash" : { "$binary" : "joFIiOgu32NHAVrAO40lHKl7/i8=", "$type" : "00" },
            "keyId" : NumberLong(6778940624956555265)
        }
    }
}

, поэтому у меня есть 2 вопроса,

  1. Как повысить производительность запросов?
  2. Я вижу, что индексы {"inventory.productId":1, _id:1} и {_id:1,"inventory.productId":1} имеют разный размер. в чем разница между ними?

1 Ответ

1 голос
/ 24 марта 2020
  1. Иногда Mon go выбирает неправильный индекс, в основном Mon go выполняет мини-гонку между доступными индексами и выбирает тот, который сначала выбирает 101 документ.

    Очевидно, это не обязательно означает, что был выбран лучший индекс. как и в вашем случае, чтобы избежать этого, вы можете использовать подсказку , это заставит пн go использовать индекс по вашему выбору, который сделает запрос намного быстрее.

  2. Пн go строит свои индексы как B-деревья , из-за характера распределения данных деревья строятся по-разному и имеют другие размеры. Есть интересное и более подробное объяснение того, как они строят индексы в этом видео. но без погружения в исходный код это останется для вас «черным ящиком».

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...