Пожалуйста, смотрите Редактировать в конце поста, я решил исходный вопрос, но с тех пор изменил вопрос.
Я пишу, чтобы посмотреть, можно ли мне помочь в некоторых код, который я использовал для сортировки дат в CSV-файле, так что все, что старше, чем, скажем, 5 дней, удаляется.
Это раздел кода, который управляет настройкой даты минус timedelta (days = 5) а затем проверяет, что с текущей датой, чтобы вы в конечном итоге с диапазоном 2020-03-12 до 2020-03-17 и все, что подходит, сохраняется. (этот пример основан на использовании 5 дней, он может go отодвинуться дальше или короче)
df2 = pd.read_csv('example.csv')
df2 = df2.drop(['Unnamed: 0'], axis=1)
df2['comment.createTime'] = pd.to_datetime(df2['comment.createTime'])
df2 = df2.set_index([comment.createTime'])
end_range = datetime.now().date()
d = d = datetime.today() - timedelta(days=5)
start_range = d.date()
df3 = df2[end_range:start_range]
Моя проблема в том, что любые отзывы оставлены на текущий день, или, может быть, даже один день go также отфильтровываются и не отображаются в следующем сегменте, что приводит к невозможности работы остальной части кода.
Пример даты, извлекаемой из файла example.csv
John Doe,FIVE,Amazing Experience!,2020-03-17T14:50:05.197Z
Этот пример, поскольку он относится к текущей дате, будет удален, а не сохранен и передан в следующие сегменты сценария.
Jane Doe,ONE,Horrible,2020-03-10T23:55:26.452Z
Этот пример, если timedelta (days = 5) была будет установлено значение дней = 10, но опять-таки Джону Доу не будет.
Я думаю, я мог бы просто подождать день или около того, затем запустить его и посмотреть, подхватит ли он обзор, а затем использовать его таким образом, но я надеялся, что не смогу отфильтровать текущие обзоры дат, чтобы я мог запускать скрипт, скажем, каждый час, и он реагирует на все с предыдущего часа, когда он был в последний раз. запустить его в 2 часа дня, и он будет работать с 13:00 до 14:00, работать с 15:00 и с 14:00 до 15:00 и так далее.
Уважаемые упоминания о попытках, которые я пытался и не работал.
df2 = pd.read_csv('example.csv')
df2['comment.createTime'] = pd.to_datetime(df2['comment.createTime'])
df2 = df2.set_index([comment.createTime'])
end_range = datetime.now().date()
d = d = datetime.today() - timedelta(days=5)
start_range = d.date()
df3 = df2[end_range:start_range]
df2 = pd.read_csv('example.csv')
df2 = df2.drop(['Unnamed: 0'], axis=1)
df2['comment.createTime'] = pd.to_datetime(df2['review.createTime'])
df2 = df2.set_index([comment.createTime'])
end_range = datetime.now().date()
d = d = datetime.today() - timedelta(days=-1)
start_range = d.date()
df3 = df2[end_range:start_range]
df2 = pd.read_csv('example.csv')
df2 = df2.drop(['Unnamed: 0'], axis=1)
df2['comment.createTime'] = pd.to_datetime(df2[comment.createTime'])
df2 = df2.set_index([comment.createTime'])
df3 = df2['2020-03-17':'2020-03-12']
Я хотел бы добавить здесь правку.
df2 = pd.read_csv('gmb_batchreviews.csv')
df2 = df2.drop(['Unnamed: 0'], axis=1)
df2['review.createTime'] = pd.to_datetime(df2['review.createTime'])
df2 = df2.set_index(['review.createTime'])
end_range = datetime.now().date() + pd.DateOffset(days=1)
d = d = datetime.today() - timedelta(days=0)
start_range = d.date()
df3 = df2[end_range:start_range]
Приведенный выше код работает для того, что я хочу, вытягивая все из «сегодня» вперед датировка конца_рейнджа Теперь мой вопрос немного перерос в то, как я могу изменить его, чтобы отсортировать по времени, а не по дням?