преобразование списка целых чисел в диапазон в Python - PullRequest
26 голосов
/ 07 января 2011

Существует ли в python что-то, что может преобразовать растущий список целых чисел в список диапазонов

Например, заданный набор {0, 1, 2, 3, 4, 7, 8, 9, 11}Я хочу получить {{0,4}, {7,9}, {11,11}}.

Я могу написать программу для этого, но хочу знать, есть ли встроенная функция в python

Ответы [ 9 ]

35 голосов
/ 07 января 2011

Использование itertools.groupby() дает краткую, но сложную реализацию:

import itertools

def ranges(i):
    for a, b in itertools.groupby(enumerate(i), lambda (x, y): y - x):
        b = list(b)
        yield b[0][1], b[-1][1]

print list(ranges([0, 1, 2, 3, 4, 7, 8, 9, 11]))

Выход:

[(0, 4), (7, 9), (11, 11)]
9 голосов
/ 07 января 2011

Вы можете использовать список с генератором выражения и комбинацией enumerate () и itertools.groupby () :

>>> import itertools
>>> l = [0, 1, 2, 3, 4, 7, 8, 9, 11]
>>> [[t[0][1], t[-1][1]] for t in
... (tuple(g[1]) for g in itertools.groupby(enumerate(l), lambda (i, x): i - x))]
[[0, 4], [7, 9], [11, 11]]

Сначала enumerate() создаст кортежи из элементов списка и их соответствующих индексов:

>>> [t for t in enumerate(l)]
[(0, 0), (1, 1), (2, 2), (3, 3), (4, 4), (5, 7), (6, 8), (7, 9), (8, 11)]

Затем groupby() сгруппирует эти кортежи, используя разницумежду их индексом и их значением (которое будет равно для последовательных значений):

>>> [tuple(g[1]) for g in itertools.groupby(enumerate(l), lambda (i, x): i - x)]
[((0, 0), (1, 1), (2, 2), (3, 3), (4, 4)), ((5, 7), (6, 8), (7, 9)), ((8, 11),)]

Оттуда нам нужно только построить списки из значений первого и последнего кортежей каждой группы (которые будутто же самое, если группа содержит только один элемент).

Вы также можете использовать [(t[0][1], t[-1][1]) ...] для построения списка кортежей диапазонов вместо вложенных списков или даже ((t[0][1], t[-1][1]) ...), чтобы превратить все выражение в итерируемое generator, который будет лениво создавать кортежи диапазона на лету.

6 голосов
/ 29 марта 2017

Это улучшение по сравнению с очень элегантным @ juanchopanza answer . Этот элемент охватывает неуникальный и несортированный вход и также совместим с python3 :

import itertools

def to_ranges(iterable):
    iterable = sorted(set(iterable))
    for key, group in itertools.groupby(enumerate(iterable),
                                        lambda t: t[1] - t[0]):
        group = list(group)
        yield group[0][1], group[-1][1]

Пример:

>>> x
[44, 45, 2, 56, 23, 11, 3, 4, 7, 9, 1, 2, 2, 11, 12, 13, 45]

>>> print( list(to_ranges(x))) 
[(1, 4), (7, 7), (9, 9), (11, 13), (23, 23), (44, 45), (56, 56)]
3 голосов
/ 07 января 2011

Этот генератор:

def ranges(p):
    q = sorted(p)
    i = 0
    for j in xrange(1,len(q)):
        if q[j] > 1+q[j-1]:
            yield (q[i],q[j-1])
            i = j
    yield (q[i], q[-1])

sample = [0, 1, 2, 3, 4, 7, 8, 9, 11]
print list(ranges(sample))
print list(ranges(reversed(sample)))
print list(ranges([1]))
print list(ranges([2,3,4]))
print list(ranges([0,2,3,4]))
print list(ranges(5*[1]))

Дает эти результаты:

[(0, 4), (7, 9), (11, 11)]
[(0, 4), (7, 9), (11, 11)]
[(1, 1)]
[(2, 4)]
[(0, 0), (2, 4)]
[(1, 1)]

Обратите внимание, что серии повторяющихся чисел сжаты . Я не знаю, если вы этого хотите. Если нет, замените > на !=.

Я понимаю ваш вопрос. Я изучил itertools и попытался придумать решение, которое можно было бы реализовать в нескольких строках Python, которое квалифицировалось бы как «почти встроенный» , но я не смог придумать с чем угодно.

2 голосов
/ 29 января 2015

Генерация пар диапазонов:

def ranges(lst):
    s = e = None
    r = []
    for i in sorted(lst):
        if s is None:
            s = e = i
        elif i == e or i == e + 1:
            e = i
        else:
            r.append((s, e))
            s = e = i
    if s is not None:
        r.append((s, e))
    return r

Пример:

>>> lst = [1, 5, 6, 7, 12, 15, 16, 17, 18, 30]
>>> print repr(ranges(lst))
[(1, 1), (5, 7), (12, 12), (15, 18), (30, 30)]

Как генератор:

def gen_ranges(lst):
    s = e = None
    for i in sorted(lst):
        if s is None:
            s = e = i
        elif i == e or i == e + 1:
            e = i
        else:
            yield (s, e)
            s = e = i
    if s is not None:
        yield (s, e)

Пример:

>>> lst = [1, 5, 6, 7, 12, 15, 16, 17, 18, 30]
>>> print repr(','.join(['%d' % s if s == e else '%d-%d' % (s, e) for (s, e) in gen_ranges(lst)]))
'1,5-7,12,15-18,30'
1 голос
/ 10 мая 2017

Я думаю, что другие ответы трудны для понимания и, вероятно, неэффективны.Надеюсь, что это проще и быстрее.

def ranges(ints):
    ints = sorted(set(ints))
    range_start = previous_number = ints[0]
    for number in ints[1:]:
        if number == previous_number + 1:
            previous_number = number
        else:
            yield range_start, previous_number
            range_start = previous_number = number
    yield range_start, previous_number
1 голос
/ 30 октября 2012

Короче говоря:

ranges=lambda l:map(lambda x:(x[0][1],x[-1][1]),map(lambda (x,y):list(y),itertools.groupby(enumerate(l),lambda (x,y):x-y)))
1 голос
/ 07 января 2011

В случае, если в Python такой функции нет, вот реализация

p = []
last = -2                                                            
start = -1

for item in list:
    if item != last+1:                        
        if start != -1:
            p.append([start, last])
        start = item
    last = item

p.append([start, last])
1 голос
/ 07 января 2011

Ничего встроенного или каких-либо библиотек, о которых я знаю.Не очень полезно, я знаю, но я никогда не сталкивался с чем-то вроде того, что вы хотите.

Вот некоторые идеи для вашей программы по крайней мере (на C ++, но она может дать вам некоторые другие идеи):

Преобразование наборов целых чисел в диапазоны

...