Как я могу получить похожий дистрибутив из разных групп? - PullRequest
0 голосов
/ 19 февраля 2019

Я должен найти в подгруппах наборов данных с аналогичным средним для 2 метрик, чем моя исходная группа.

Например, я хотел бы найти город или группу городов с ближайшими average(metric 1) = 10 и average(metric 2) = 5.

Пример набора данных:

enter image description here

Как я могу это сделать?

1 Ответ

0 голосов
/ 19 февраля 2019

Просто сгруппировать по городам, а затем отсортировать по закрывающему значению (я только что добавил два столбца метрики, надеюсь, что все в порядке, так как у меня нет подробностей, что такое метрика)

df2 = df.groupby(['city']).mean()

input1 = 10
input2 = 5

df_sort = df2.iloc[((df2['metric 1']-input1)+(df2['metric 2']-input2)).abs().argsort()]
...