Функциональность Pandas Dataframe - PullRequest
0 голосов
/ 19 февраля 2019

Я хотел бы создать кадры данных, используя таблицы Excel в качестве исходных данных.Мне нужно преобразовать ряд данных из формата, используемого для хранения данных в электронных таблицах Excel, в конечный продукт переменной dataframe.

Я хотел бы знать, есть ли у пользователей опыт использования различных методов python для выполнения следующих задач::

Преобразование ряда данных: у меня есть ряд, который включает одно значение данных в месяц, но хотел бы расширить таблицу значений, включив одно значение в день, используя индекс (или, возможно, столбец со значениями даты),Таким образом, если таблица1 имеет индекс на основе месяца, а таблица2 - дневной индекс, как я могу преобразовать значения таблицы1 в индекс на основе таблицы2.

- построение структуры данных: данные, с которыми я работаю, имеют разную длину, некоторые наборы данных длиннее других.Какими методами можно найти самую короткую длину ряда в столбце в контексте многоколоночного фрейма данных?

По сути, я хотел бы взять отдельные таблицы из рабочих книг и объединить их в один фрейм данных, который используетединое значение индекса как основа для их представления.Мои таблицы рабочих книг могут иметь частоту точек данных ежедневно, еженедельно или ежемесячно, и я хотел бы создать фрейм данных, который использует ежедневный индекс в качестве основы для элементов таблицы, включая элементы для каждого дня в серии, еженедельной и ежемесячной.

Я смотрю на библиотеку Pandas, но, возможно, есть другие библиотеки, которые я упустил из виду с дополнительными функциями.

Спасибо за помощь!

1 Ответ

0 голосов
/ 19 февраля 2019

В качестве первого вопроса попробуйте что-то вроде:

df1 = df1.resample('1d').first()
df2.merge(df1)

Это увеличит выборку ваших ежемесячных или еженедельных фреймов данных и объединит их с вашим ежедневным фреймом данных.Взгляните на метод интерполяции , чтобы заполнить пропущенные значения.Чтобы получить название самого короткого столбца, попробуйте это:

df.count().idxmin()

Надеюсь, это поможет!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...