Question

Мои 500 фреймов данных выглядят следующим образом: это день на основе данных за 2 года.

Дата |Столбец А |Колонка B
2017-04-04
2017-04-05
2017-04-06
2017-04-07
....
2017-04-02
...
2019-02-01
2019-02-11
2019-02-22
2019-02-27
2019-03-01
2019-04-01
2019-05-01

Все кадры данных имеют одинаковое количество столбцов, но разное количество строк.Все эти DataFrames имеют несколько похожих временных отметок.Я хочу получить точные общие метки времени для всех моих фреймов данных.

Цель состоит в том, чтобы отфильтровать общие метки времени во всех моих 500 фреймах данных и создать подмножество новых 500 фреймов данных только с обычными временными метками.

ALollz · Answer 1 · 29 марта 2019

Если вы можете сохранить все 500 в памяти одновременно, то полезно хранить их в словаре.Затем вы можете найти пересечение всех дат, а затем сохранить подмножества:

import pandas as pd
from functools import reduce

d = dict((file, pd.read_csv(file)) for file in [your_list_of_files])

date_com = reduce(lambda l,r: l & r [set(df.Date) for _,df in d.items()])

for file,df in d.items():
    df[df.Date.isin(date_com)].to_csv(f'adjusted_{file}')

Извлекать похожие даты из нескольких панелей данных

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Извлекать похожие даты из нескольких панелей данных

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы