Question

У меня есть отсортированный список дат: (с перерывами)

list_of_dts = [
              datetime.datetime(2012,1,1,0,0,0), 
              datetime.datetime(2012,1,1,1,0,0), 
              datetime.datetime(2012,1,2,0,0,0), 
              datetime.datetime(2012,1,3,0,0,0),
              datetime.datetime(2012,1,5,0,0,0),
              ]

И я бы хотел разделить их на список на каждый день:

result = [
          [datetime.datetime(2012,1,1,0,0,0), datetime.datetime(2012,1,1,1,0,0)],
          [datetime.datetime(2012,1,2,0,0,0)],
          [datetime.datetime(2012,1,3,0,0,0)],
          [], # Empty list for no datetimes on day
          [datetime.datetime(2012,1,5,0,0,0)]
         ]

Алгоритмически должно быть возможно достичь по крайней мере O (n).

Возможно, что-то вроде следующего: (Это, очевидно, не обрабатывает пропущенные дни, и отбрасывает последний DT, но это начало)

def dt_to_d(list_of_dts):
    result = []
    start_dt = list_of_dts[0]
    day = [start_dt]
    for i, dt in enumerate(list_of_dts[1:]):
        previous = start_dt if i == 0 else list_of_dts[i-1]
        if dt.day > previous.day or dt.month > previous.month or dt.year > previous.year: 
            # split to new sub-list
            result.append(day)
            day = []
            # Loop for each day gap?
        day.append(dt)
    return result

Мысли

Raymond Hettinger · Answer 1 · 24 января 2012

Самый простой способ - использовать dict.setdefault , чтобы сгруппировать записи, приходящиеся на один и тот же день, а затем перейти от самого низкого дня к самому высокому:

>>> import datetime
>>> list_of_dts = [
              datetime.datetime(2012,1,1,0,0,0),
              datetime.datetime(2012,1,1,1,0,0),
              datetime.datetime(2012,1,2,0,0,0),
              datetime.datetime(2012,1,3,0,0,0),
              datetime.datetime(2012,1,5,0,0,0),
              ]

>>> days = {}
>>> for dt in list_of_dts:
        days.setdefault(dt.toordinal(), []).append(dt)

>>> [days.get(day, []) for day in range(min(days), max(days)+1)]
[[datetime.datetime(2012, 1, 1, 0, 0), datetime.datetime(2012, 1, 1, 1, 0)], 
 [datetime.datetime(2012, 1, 2, 0, 0)],
 [datetime.datetime(2012, 1, 3, 0, 0)],
 [],
 [datetime.datetime(2012, 1, 5, 0, 0)]]

Другим подходом для создания таких группировок является itertools.groupby . Он предназначен для такого рода работы, но не позволяет заполнять пустой список за пропущенные дни:

>>> import itertools
>>> [list(group) for k, group in itertools.groupby(list_of_dts,
                                                   key=datetime.datetime.toordinal)]
[[datetime.datetime(2012, 1, 1, 0, 0), datetime.datetime(2012, 1, 1, 1, 0)], 
 [datetime.datetime(2012, 1, 2, 0, 0)],
 [datetime.datetime(2012, 1, 3, 0, 0)],
 [datetime.datetime(2012, 1, 5, 0, 0)]]

qiao · Answer 2 · 24 января 2012

Вы можете использовать itertools.groupby , чтобы легко решить такие проблемы:

import datetime
import itertools

list_of_dts = [
        datetime.datetime(2012,1,1,0,0,0), 
        datetime.datetime(2012,1,1,1,0,0), 
        datetime.datetime(2012,1,2,0,0,0), 
        datetime.datetime(2012,1,3,0,0,0),
        datetime.datetime(2012,1,5,0,0,0),
        ]

print [list(g) for k, g in itertools.groupby(list_of_dts, key=lambda d: d.date())]

Lex · Answer 3 · 24 января 2012

list_of_dts = [
            datetime.datetime(2012,1,1,0,0,0), 
            datetime.datetime(2012,1,1,1,0,0), 
            datetime.datetime(2012,1,2,0,0,0), 
            datetime.datetime(2012,1,3,0,0,0),
            datetime.datetime(2012,1,5,0,0,0),
            ]

groupedByDay={}
for date in list_of_dts:
    if date.date() in groupedByDay:
        groupedByDay[date.date()].append(date)
    else:
        groupedByDay[date.date()]=[date]

Теперь у вас есть словарь, в котором дата - это ключ, а значение - список похожих дат.

и если у вас есть список вместо

result = groupedByDay.values()
result.sort()

теперь результаты представляют собой список списков, в котором все даты с одним и тем же днем сгруппированы вместе

Paulo Scardine · Answer 4 · 24 января 2012

Заполнение пробелов:

date_dict = {}
for date_value in list_of_dates:
    if date_dict.has_key(date_value.date()):
        date_dict[date_value.date()].append(date_value)
    else:
        date_dict[date_value.date()] = [ date_value ]
sorted_dates = sorted(date_dict.keys())
date = sorted_dates[0]
while date <= sorted_dates[-1]:
    print date_dict.get(date, [])
    date += datetime.timedelta(1)

Результаты:

[datetime.datetime(2012, 1, 1, 0, 0), datetime.datetime(2012, 1, 1, 1, 0)]
[datetime.datetime(2012, 1, 2, 0, 0)]
[datetime.datetime(2012, 1, 3, 0, 0)]
[]
[datetime.datetime(2012, 1, 5, 0, 0)]

Это решение не требует сортировки исходного списка даты и времени.

Разделить список дат и дней на дни

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Разделить список дат и дней на дни

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы