Как я могу выполнить запрос «Группировать по» прямо или косвенно в Cosmos DB? - PullRequest
0 голосов
/ 29 мая 2019

У меня есть коллекция Cosmos DB с 4 миллионами предметов. Моя главная проблема заключается в том, как я могу выполнить запрос 'group by'.

Пока я экспортирую его в хранилище больших двоичных объектов json.gz. Преобразуйте его в локальный файл CSV из локальной программы на C #. Затем запустите на нем простой R-скрипт, который выполняет эту группу по.

Я хотел бы запустить весь процесс в Azure (используя приложение логики Azure).

Какой лучший способ сделать это?

Спасибо!

1 Ответ

1 голос
/ 30 мая 2019

Для .NET и Node.js

Ларри Макчероне предоставил отличный пакет documentdb-lumenize, который поддерживает агрегации (группирование, сводную таблицу и N-мерный куб) и преобразования временных рядов в качестве хранимых процедур в DocumentDB. Кроме того, для Python и Scala вы можете обратиться к azure-cosmosdb-spark.

Вы можете сослаться на эту тему .

Надеюсь, это поможет.

...