DataFrame.resample () дублирует столбцы - PullRequest
0 голосов
/ 11 апреля 2020

У меня есть pandas DataFrame, self.data, в котором есть некоторые интересующие меня столбцы и некоторые столбцы, которые я могу удалить.

Когда я хочу выбрать столбец в DataFrame, я вызываю self.data[column] и возвращаю серию.

Я собираю список столбцов self.useful_columns, снимок которого показано ниже:

useful_columns = ['P(M): ~RackA\\Cnd\\Ctrl (kPa)', 'P(C): ~RackA\\Cnd\\CtrlStPt (kPa)', ...]

Затем я повторно делаю выборку DataFrame, передавая список полезных столбцов, ожидая отфильтровать столбцы, которые мне не нужны, и повторно формировать DataFrame в требуемый временной интервал.

self.data = self.data[self.useful_columns].resample(interval).mean()

После выполнения повторной выборки, когда я выбираю тот же столбец self.data[column], я возвращаю DataFrame, а не Series.

Оба столбца, которые теперь имеют одинаковое имя в новом DataFrame, имеют одинаковые данные.

Несколько сбивает с толку, если я выберу другой столбец из DataFrame (который также существует в списке useful_columns) Я возвращаю серию оба раза. Типы данных этого столбца с соответствующим поведением и столбца, который дублируется, float64.

Есть какие-либо мысли о том, что вызывает дублирование столбцов?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...