У меня есть два dataframes
, которые содержат рыночные данные на конец дня. Предполагается, что они содержат одинаковые даты начала и окончания, а также количество строк, но когда я печатаю len
каждой, одна больше, чем другая:
DF1
close
date
2008-01-01 45.92
2008-01-02 45.16
2008-01-03 45.33
2008-01-04 42.09
2008-01-07 46.98
...
[2870 rows x 1 columns]
DF2
close
date
2008-01-01 60.48
2008-01-02 59.71
2008-01-03 58.43
2008-01-04 56.64
2008-01-07 56.98
...
[2871 rows x 1 columns]
Как я могу показать, какая строка либо:
- имеет повторяющийся ряд,
- или имеет дополнительную дату
, чтобы я мог удалить строку [вероятных] выходных / праздничных дней, которая находится в DF2
, но не в DF1
?
Я пробовал такие вещи, как:
df1 = df1.drop_duplicates(subset='date', keep='first')
df2 = df1.drop_duplicates(subset='date', keep='first')
но не могу заставить его работать [ValueError: not enough values to unpack (expected 2, got 0)
].
Дополнительно:
Как удалить даты выходных из кадра данных?