Разбор JSON - группировка по диапазону дат с JQ - PullRequest
0 голосов
/ 15 января 2019

У меня есть следующие данные JSON:

{
  "data": [  
    {"date": "2018-08-22","value": 1},
    {"date": "2018-08-30","value": 2},
    {"date": "2018-09-01","value": 3},
    {"date": "2018-09-22","value": 3},
    {"date": "2018-09-28","value": 4},
    {"date": "2018-10-18","value": 5},
    {"date": "2018-10-23","value": 6}
  ]
}

Я хотел бы использовать JQ для группировки данных за месяц, начиная с первого значения: Мой месяц будет:

  • 2018 08 22 до 2018 09 21

  • 2018 09 22 до 2018 10 21

  • 2018 10 22 до 2018 11 21

Мой ожидаемый результат следующий:

{
  "data": [  
    {"month": "2018-08-22 to 2018-09-21","sum": 6},
    {"month": "2018-09-22 to 2018-10-21","sum": 12},
    {"month": "2018-10-23 to 2018-11-21","sum": 6}
  ]
}

Как я могу это сделать?

1 Ответ

0 голосов
/ 15 января 2019

Решение легко получить с помощью следующей вспомогательной функции:

# $day should be the day (an integer) that defines the cutoff point;
# input should be a Y-M-D string
def bucket($day):
  def prev: if .m > 1 then .m -= 1 else .m = 12 | .y -= 1 end;
  def fmt: if .m <= 9 then "\(.y)-0\(.m)" else "\(.y)-\(.m)" end;
  capture("(?<y>[0-9]+)-(?<m>[0-9]+)-(?<d>[0-9]+)")
  | map_values(tonumber)
  | if .d >= $day then . else prev end
  | fmt ;

Теперь мы вычислим пары подсчета сегментов:

.data
| (.[0].date | capture("(?<d>[0-9]+)$") | .d | tonumber) as $day
| reduce .[] as $pair ({};
  .[$pair.date | bucket($day)] += ($pair.value) )

С данными выборки это дает:

{
  "2018-08": 6,
  "2018-09": 12,
  "2018-10": 6
}      

Теперь преобразовать это в нужный формат тривиально, и поэтому мы оставляем его в качестве упражнения.

...