Как я могу получить УНИКАЛЬНЫЕ категории из всех документов в CosmosDB? - PullRequest
0 голосов
/ 23 ноября 2018

У меня есть миллионы документов в CosmosDB с использованием SQL API, и мне нужно найти уникальные категории из всех документов.

Документы выглядят следующим образом, вы можете увидеть массив категорий прямо под описанием, яМне все равно, в каком они порядке. Мне просто нужно знать все уникальные из всех документов в коллекции, мне нужно это, чтобы потом я мог создавать запросы по категориям, но это более поздний вопрос, мне сначала нужно получить их всепоэтому я знаю, какие есть все возможные варианты, но я не могу понять, как сделать запрос, чтобы я получал только имена категорий.

{
    "id": "56d934d3-90bf-4f5a-b602-e515fefa599f",
    "_id": "5bf6705f9568cf00013cd13c",
    "vendor": "XXX",
    "updatedAt": "2018-11-23T03:55:30.044Z",
    "locales": [
        {
            "title": "Cold shoulder t-shirt",
            "description": "Because collar bones. Trending cold shoulder t-shirt in 100% organic cotton. Classic, wide and boxy t-shirt fit with cut-out details. In black, because black tees and fashion are like this (insert friendly hand gesture). This style is online exclusive.",
            "categories": [
                "Women",
                "clothing",
                "tops"
            ],
            "brand": null,
            "images": [
                "https://lp.xxx.com/app002prod?set=source[01_0659881_001_102],type[ECOMLOOK],device[hdpi],quality[80],ImageVersion[2018081]&call=url[file:/product/main]",
                "https://lp.xxx.com/app002prod?set=source[01_0659881_001_203],type[ECOMLOOK],device[hdpi],quality[80],ImageVersion[2018081]&call=url[file:/product/main]",
                "https://lp.xxx.com/app002prod?set=source[01_0659881_001_301],type[ECOMLOOK],device[hdpi],quality[80],ImageVersion[2018081]&call=url[file:/product/main]",
                "https://lp.xxx.com/app002prod?set=source[02_0659881_001_101],type[PRODUCT],device[hdpi],quality[80],ImageVersion[1.0]&call=url[file:/product/main]"
            ],
            "country": "SE",
            "currency": "SEK",
            "language": "en",
            "variants": [
                {
                    "artno": "0659881001",
                    "urls": [
                        "https://click.linksynergy.com/link?id=INtcw3sexSw&offerid=491018&type=2&murl=https%3A%2F%2Fwww.xxx.com%2Fen_sek%2Fclothing%2Ftops%2Fproduct.cold-shoulder-t-shirt-black-magic.0659881001.html"
                    ],
                    "price": 80,
                    "stock": 0,
                    "attributes": {
                        "size": "XXS",
                        "color": "Black magic"
                    }
                },
                {
                    "artno": "xxx",
                    "urls": [
                        "https://click.linksynergy.com/link?id=INtcw3sexSw&offerid=491018&type=2&murl=https%3A%2F%2Fwww.xxx.com%2Fen_sek%2Fclothing%2Ftops%2Fproduct.cold-shoulder-t-shirt-black-magic.0659881001.html"
                    ],
                    "price": 80,
                    "stock": 0,
                    "attributes": {
                        "size": "XS",
                        "color": "Black magic"
                    }
                },
                {
                    "artno": "0659881001",
                    "urls": [
                        "https://click.linksynergy.com/link?id=INtcw3sexSw&offerid=491018&type=2&murl=https%3A%2F%2Fwww.xxx.com%2Fen_sek%2Fclothing%2Ftops%2Fproduct.cold-shoulder-t-shirt-black-magic.0659881001.html"
                    ],
                    "price": 80,
                    "stock": 0,
                    "attributes": {
                        "size": "XL",
                        "color": "Black magic"
                    }
                },
                {
                    "artno": "0659881001",
                    "urls": [
                        "https://click.linksynergy.com/link?id=INtcw3sexSw&offerid=491018&type=2&murl=https%3A%2F%2Fwww.xxx.com%2Fen_sek%2Fclothing%2Ftops%2Fproduct.cold-shoulder-t-shirt-black-magic.0659881001.html"
                    ],
                    "price": 80,
                    "stock": 0,
                    "attributes": {
                        "size": "S",
                        "color": "Black magic"
                    }
                },
                {
                    "artno": "0659881001",
                    "urls": [
                        "https://click.linksynergy.com/link?id=INtcw3sexSw&offerid=491018&type=2&murl=https%3A%2F%2Fwww.xxx.com%2Fen_sek%2Fclothing%2Ftops%2Fproduct.cold-shoulder-t-shirt-black-magic.0659881001.html"
                    ],
                    "price": 80,
                    "stock": 1,
                    "attributes": {
                        "size": "M",
                        "color": "Black magic"
                    }
                },
                {
                    "artno": "0659881001",
                    "urls": [
                        "https://click.linksynergy.com/link?id=INtcw3sexSw&offerid=491018&type=2&murl=https%3A%2F%2Fwww.xxx.com%2Fen_sek%2Fclothing%2Ftops%2Fproduct.cold-shoulder-t-shirt-black-magic.0659881001.html"
                    ],
                    "price": 80,
                    "stock": 0,
                    "attributes": {
                        "size": "L",
                        "color": "Black magic"
                    }
                }
            ]
        }
    ],
    "_rid": "QEwcALNbIz8GAAAAAAAAAA==",
    "_self": "dbs/QEwcAA==/colls/QEwcALNbIz8=/docs/QEwcALNbIz8GAAAAAAAAAA==/",
    "_etag": "\"6a0003c6-0000-0000-0000-5bf7958c0000\"",
    "_attachments": "attachments/",
    "_ts": 1542952332
}

1 Ответ

0 голосов
/ 26 ноября 2018

Пожалуйста, посмотрите мой тест, он может получить все уникальные имена категорий.

Образец документа:

[
    {
        "id": "1",
        "locales": [
            {
                "categories": [
                    "Women",
                    "clothing",
                    "tops"
                ]
            }
        ]
    },
    {
        "id": "2",
        "locales": [
            {
                "categories": [
                    "Men",
                    "test",
                    "tops"
                ]
            }
        ]
    }
]

SQL:

SELECT distinct cat FROM c
join l in c.locales
join cat in l.categories

Вывод:

[
    {
        "cat": "Women"
    },
    {
        "cat": "clothing"
    },
    {
        "cat": "tops"
    },
    {
        "cat": "Men"
    },
    {
        "cat": "test"
    }
]

Если вы не хотите учитывать регистр символов, просто используйте функцию LOWER в sql.

SELECT distinct Lower(cat) FROM c
join l in c.locales
join cat in l.categories

Если вы хотите получить ["Women","clothing","tops","Men","test"], она не может быть проанализированав качестве массива в одном sql напрямую, вы можете использовать хранимую процедуру для анализа выходного массива.

Например, добавьте приведенный ниже код в хранимую процедуру.

    var returnArray = [];
    for(var i=0 ;i<array.size;i++){
        returnArray.push(array[i].value)
    }
    return returnArray;
...