Сортировка большого CSV-файла с помощью pandas-groupby и использование функции .mean () - PullRequest
0 голосов
/ 25 октября 2018

У меня большой CSV-файл с 3 столбцами и множеством строк.Это выглядит примерно так: введите описание изображения здесь

Теперь я хотел бы сгруппировать все строки с ID1 и получить среднее их значения в C.

Мой код для этого выглядит так:

import pandas as pd
import numpy as np

df = pd.read_csv('file.csv', sep=";",decimal=",", index_col=0)

grouped = df.groupby(['A'])[['C']]
grouped.mean()

При выполнении кода я получаю эту ошибку:

Но в файле CSV я убедился, что нет NaN и не числовыеценности.

Что я могу с этим сделать?Большое спасибо!

Ошибка данных: нет числовых типов для агрегирования

1 Ответ

0 голосов
/ 25 октября 2018

Сообщение об ошибке указывает, что ваши типы данных не являются числовыми и не могут использоваться функциями агрегирования.Используйте

df.dtypes

для просмотра типов данных.Если они не являются int / float, вы должны конвертировать их:

df['A'] = df['A'].astype(float)

и впоследствии выполнять групповую обработку

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...