Фильтрация агрегированного графика с другим полем агрегации - PullRequest
1 голос
/ 10 февраля 2020

Я пытаюсь создать нечто похожее на пример K-top .

За исключением того, что вместо фильтрации и отображения того же агрегированного поля данных, Я хочу:

  • для отображения одного типа агрегированных данных (макс. Дневных темпов)
  • и фильтрации другого поля агрегации (среднего значения дневных темпов) )

Я создал заметную записную книжку здесь , чтобы построить свой контрольный пример, и вот как далеко я прошел.

{
  "$schema": "https://vega.github.io/schema/vega-lite/v4.json",
  "data": {"url": "data/seattle-weather.csv"},
  "transform": [
    {"timeUnit": "month", "field": "date", "as": "month_date"},
    {
      "joinaggregate": [
        {"op": "mean", "field": "precipitation", "as": "mean_precipitation"},
        {"op": "max", "field": "precipitation", "as": "max_precipitation"}
      ],
      "groupby": ["month_date"]
    },
    {
      "aggregate": [
        {"as": "aggregation", "field": "precipitation", "op": "mean"}
      ],
      "groupby": ["month_date"]
    },
    {"window": [{"op": "row_number", "as": "rank"}]},
    {"calculate": "datum.rank <= 100? datum.month_date : null", "as": "dates"},
    {"filter": "datum.dates != null"}
  ],
  "encoding": {
    "x": {"field": "dates", "type": "ordinal", "timeUnit": "month"}
  },
  "layer": [
    {
      "mark": {"type": "bar"},
      "encoding": {
        "y": {
          "aggregate": "max",
          "field": "precipitation",
          "type": "quantitative"
        }
      }
    },
    {
      "mark": "tick",
      "encoding": {
        "y": {
          "aggregate": "mean",
          "field": "precipitation",
          "type": "quantitative"
        },
        "color": {"value": "red"},
        "size": {"value": 15}
      }
    }
  ]
}

Я чувствую, что я пропускаю что-то ссылку GroupBy.ngroup из pandas.DataFrame

1 Ответ

1 голос
/ 10 февраля 2020

Вы можете сделать это, следуя примеру Vega-Lite Filtering Top-K Items вместе с дополнительным агрегированным преобразованием. Вот пример адаптации вашего spe c сверху ( vega editor ):

{
  "$schema": "https://vega.github.io/schema/vega-lite/v4.json",
  "title": "Top Months by Mean Precipitation",
  "data": {"url": "data/seattle-weather.csv"},
  "transform": [
    {"timeUnit": "month", "field": "date", "as": "month_date"},
    {
      "aggregate": [
        {"op": "mean", "field": "precipitation", "as": "mean_precipitation"},
        {"op": "max", "field": "precipitation", "as": "max_precipitation"}
      ],
      "groupby": ["month_date"]
    },
    {
      "window": [{"op": "row_number", "as": "rank"}],
      "sort": [{"field": "mean_precipitation", "order": "descending"}]
    },
    {"filter": "datum.rank < 10"}
  ],
  "encoding": {
    "x": {
      "field": "month_date",
      "type": "ordinal",
      "timeUnit": "month",
      "title": "month (descending by max precip)",
      "sort": {
        "field": "max_precipitation",
        "op": "average",
        "order": "descending"
      }
    }
  },
  "layer": [
    {
      "mark": {"type": "bar"},
      "encoding": {
        "y": {
          "field": "mean_precipitation",
          "type": "quantitative",
          "title": "precipitation (mean & max)"
        }
      }
    },
    {
      "mark": "tick",
      "encoding": {
        "y": {"field": "max_precipitation", "type": "quantitative"},
        "color": {"value": "red"},
        "size": {"value": 15}
      }
    }
  ]
}

enter image description here

...