Найти среднее значение с помощью панд в файле Excel - PullRequest
0 голосов
/ 04 января 2019

Мой файл Excel настроен с такими данными:

REV     PU LOC      DEL LOC     MILES    RPM    
3500    SANTA ANA   SAN DIEGO   160      21.875

Имеет много (500+) похожих строк данных.Я хочу найти общий pu / del loc и их средние обороты.Итак, если в этой строке 5 разных записей, я хочу использовать pandas для усреднения их значений RPM, а затем вывести их как единственное значение, указанное с помощью pu loc и del loc в отдельном файле excel.Строка, с которой я пытаюсь это сделать:

df = df.groupby(['PU LOC', 'DEL LOC', 'RPM']).mean(axis={index(0), columns(3)})

Хотя это не работает, я чувствую, что на правильном пути.Любая помощь высоко ценится!

Ответы [ 2 ]

0 голосов
/ 04 января 2019

Чтобы развернуть другой ответ, это должно приблизить вас к ожидаемому результату:

df = df.groupby(['PU LOC', 'DEL LOC']).RPM.mean().reset_index()

Примечание: арифметическое среднее RPM действительно то, что вам нужно, или оно даст большесмысл вес среднее число оборотов в минуту на количество миль, пройденных при каждом значении оборотов в минуту?

0 голосов
/ 04 января 2019

Вы не должны включать RPM в группу.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...