Решение с resample
и transform
:
Данные:
Я изменил данные вашего примера, чтобы просто позволить нашему тестовому случаю просматривать несколько дней, чтобы изменение по крайней мере за один день превысило 0,05%. Кроме того, следующий человек, который прочитает это, будет иметь воспроизводимый пример копирования и вставки.
import pandas as pd
from io import StringIO
test_data = StringIO("""Time (UTC),Ask,Bid,AskVolume,BidVolume
2007.04.01 21:00:47.593,95.203,95.159,19.1,8.8
2007.04.01 21:00:47.968,95.174,95.124,23.9,9.2
2007.04.01 21:01:02.695,95.132,95.092,4,4
2007.04.01 21:01:05.934,95.154,95.104,11.2,4
2007.04.02 21:01:18.430,95.171,95.131,12,5.2
2007.04.02 21:01:19.957,95.188,95.153,8,9.2
2007.04.02 21:01:56.308,95.208,95.148,22.3,4
2007.04.02 21:01:57.233,95.192,95.152,7.2,9.2
2007.04.03 21:01:57.443,91.188,95.143,7.2,9.2
2007.04.03 21:01:59.691,97.684,95.139,7.2,9.2
2007.04.03 21:01:59.934,95.181,95.141,8,3.9
2007.04.03 21:02:10.569,95.171,95.136,11.9,4
2007.04.04 21:02:20.708,95.166,95.126,11.2,8.8
2007.04.04 21:02:35.211,95.17,95.135,21.5,4
2007.04.04 21:02:39.946,95.196,95.156,7.2,8.8
2007.04.04 21:02:40.206,95.224,95.164,0.8,0.8
2007.04.05 21:02:43.600,95.222,95.177,8,9.2
2007.04.05 21:02:54.578,95.216,95.186,25.5,5.2
2007.04.05 21:03:04.811,95.23,95.18,7.9,7.9""")
df = pd.read_table(test_data, sep=",", header=[0], parse_dates=["Time (UTC)"])
Установить индекс для столбца даты и времени:
df.set_index("Time (UTC)", drop=True, inplace=True)
Повторная выборка и преобразование:
daily_ask = df.resample("D")["Ask"]
df["daily_ask_min"] = daily_ask.transform("min")
df["daily_ask_max"] = daily_ask.transform("max")
Рассчитать процент ежедневного изменения:
df["daily_ask_change"] = (df["daily_ask_max"] - df["daily_ask_min"]) / df["daily_ask_max"]
Найти изменения больше 0,05%:
df[df.daily_ask_change > 0.05]["daily_ask_change"]
# Time (UTC)
# 2007-04-03 21:01:57.443 0.0665
# 2007-04-03 21:01:59.691 0.0665
# 2007-04-03 21:01:59.934 0.0665
# 2007-04-03 21:02:10.569 0.0665
# Name: daily_ask_change, dtype: float64
df[df.daily_ask_change > 0.05]["daily_ask_change"].resample("D").mean()
# Time (UTC)
# 2007-04-03 0.0665
# Freq: D, Name: daily_ask_change, dtype: float64