Pandas Dataframe: зацикливание и вычисление среднего и стандартного числа по возрастающему количеству столбцов - PullRequest
0 голосов
/ 28 февраля 2019

В основном у меня есть таблица с 20 атрибутами и значением.Я хочу найти наименьшее количество атрибутов, необходимых для того, где std = 0 - (то есть, где уровень детализации идеален, чтобы разрешить 1: 1).

Я хочу установить цикл Если жестко закодированоиспользуя имена столбцов, это выглядело бы так:

for iter in range(1,21):
  dfcalc = df.groupby("LINE_NUM")["RATIO"].agg([np.mean, np.std])
  dfcalc = df.groupby("LINE_NUM","TYPE")["RATIO"].agg([np.mean, np.std])

Как я могу использовать переменную iter в цикле, чтобы определить столбцы, по которым я хочу сгруппировать?

1 Ответ

0 голосов
/ 28 февраля 2019

Если я правильно понимаю, что вы хотите, вы могли бы сделать это:

for i in range(1, len(df.columns) + 1):
    df.groupby(df.columns[:i].tolist()).agg([np.mean, np.std])

(iter - это имя встроенной функции)

Вы также можете использовать .ilocдля индексирования на основе целых чисел .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...