Я бы хотел сделать сравнение среди предметов в серии панд. Если элемент не равен следующему значению, добавьте его в список, иначе продолжайте. Я думаю, что мой код работает, за исключением того, что он терпит неудачу в последнем случае, потому что индекс элементов [k + 1] находится вне диапазона. Как мне получить это, чтобы прекратить сравнение в последнем ряду?
Я делаю это, потому что у меня есть набор данных, предположительно упорядоченный по дате, но у меня нет поля метки времени. Я знаю только, начиная с месяца и года и заканчивая месяцем и годом.
Однако одно включенное поле (поле euribor3m) должно быть дневным, поэтому я надеюсь, что смогу отделить каждый день, а затем создать временную метку, просто сравнивая строки со следующей строкой и замечая, если значение для поля изменилось. Если это так, это будет означать, что новые строки отображаются на новый день, и, поскольку строки упорядочены по дням, я надеюсь, что я получу общее количество x дней, соответствующих количеству дней между началом месяца-годом и концом месяца-года.
items = dict(enumerate(df['euribor3m']))
unique = []
for k,i in items.items():
if items[k+1] != items[k]:
unique.append(items[k+1])