Эквивалент Python для #each_cons Руби? - PullRequest
14 голосов
/ 04 мая 2011

Есть ли Pythonic эквивалентный Ruby's #each_cons?

В Ruby вы можете сделать это:

array = [1,2,3,4]
array.each_cons(2).to_a
=> [[1,2],[2,3],[3,4]]

Ответы [ 8 ]

16 голосов
/ 04 мая 2011

Я не думаю, что есть, я просмотрел встроенный модуль itertools, где я и ожидал.Вы можете просто создать один из них:

def each_cons(x, size):
    return [x[i:i+size] for i in range(len(x)-size+1)]
11 голосов
/ 04 мая 2011

Для таких вещей, itertools - это модуль, на который вы должны смотреть:

from itertools import tee, izip

def pairwise(iterable):
    "s -> (s0,s1), (s1,s2), (s2, s3), ..."
    a, b = tee(iterable)
    next(b, None)
    return izip(a, b)

Тогда:

>>> list(pairwise([1, 2, 3, 4]))
[(1, 2), (2, 3), (3, 4)]

Для еще более общего решения рассмотрим следующее:

def split_subsequences(iterable, length=2, overlap=0):
    it = iter(iterable)
    results = list(itertools.islice(it, length))
    while len(results) == length:
        yield results
        results = results[length - overlap:]
        results.extend(itertools.islice(it, length - overlap))
    if results:
        yield results

Это допускает произвольные длины подпоследовательностей и произвольное перекрытие. Использование:

>> list(split_subsequences([1, 2, 3, 4], length=2))
[[1, 2], [3, 4]]
>> list(split_subsequences([1, 2, 3, 4], length=2, overlap=1))
[[1, 2], [2, 3], [3, 4], [4]]
5 голосов
/ 14 октября 2012

Мое решение для списков (Python2):

import itertools
def each_cons(xs, n):
    return itertools.izip(*(xs[i:] for i in xrange(n)))

Редактировать: С Python 3 itertools.izip больше не используется, поэтому вы используете обычный zip:

def each_cons(xs, n):
    return zip(*(xs[i:] for i in range(n)))
4 голосов
/ 04 мая 2011

Python, безусловно, может сделать это. Если вы не хотите делать это с таким нетерпением, используйте iserice и izip itertool. Кроме того, важно помнить, что нормальные фрагменты создадут копию, поэтому, если использование памяти важно, вы также должны учитывать эквиваленты itertool.

each_cons = lambda l: zip(l[:-1], l[1:])

4 голосов
/ 04 мая 2011

Быстрый однострочник:

a = [1, 2, 3, 4]

out = [a[i:i + 2] for i in range(len(a) - 1)]
3 голосов
/ 12 января 2014

ОБНОВЛЕНИЕ: Не берите в голову мой ответ ниже, просто используйте toolz.itertoolz.sliding_window() - это будет правильно.


Для действительно ленивой реализации, которая сохраняет поведение each_cons Руби, когда последовательность / генератор имеет недостаточную длину:

import itertools
def each_cons(sequence, n):
    return itertools.izip(*(itertools.islice(g, i, None)
                          for i, g in
                          enumerate(itertools.tee(sequence, n))))

Примеры:

>>> print(list(each_cons(xrange(5), 2)))
[(0, 1), (1, 2), (2, 3), (3, 4)]
>>> print(list(each_cons(xrange(5), 5)))
[(0, 1, 2, 3, 4)]
>>> print(list(each_cons(xrange(5), 6)))
[]
>>> print(list(each_cons((a for a in xrange(5)), 2)))
[(0, 1), (1, 2), (2, 3), (3, 4)]

Обратите внимание, что распаковка кортежа, используемая в аргументах для izip, применяется к кортежу с размером n, результатом которого является itertools.tee(xs, n) (то есть "размер окна"), а не последовательность, которую мы хотим повторить.

1 голос
/ 11 апреля 2019

Близко к решению @ Blender, но с исправлением:

a = [1, 2, 3, 4]
n = 2
out = [a[i:i + n] for i in range(len(a) - n + 1)]
# => [[1, 2], [2, 3], [3, 4]]

Или

a = [1, 2, 3, 4]
n = 3
out = [a[i:i + n] for i in range(len(a) - n + 1)]
# => [[1, 2, 3], [2, 3, 4]]
1 голос
/ 25 ноября 2014

То же, что и код Элиаса, но работает для Python 2 и 3:

try:
    from itertools import izip  # python 2
except ImportError:
    from builtins import zip as izip  # python 3

from itertools import islice, tee

def each_cons(sequence, n):
    return izip(
        *(
            islice(g, i, None)
            for i, g in
            enumerate(tee(sequence, n))
        )
    )
...