Итерация по строке 2 (или n) символов за раз в Python - PullRequest
31 голосов
/ 22 июля 2009

Раньше сегодня мне нужно было перебирать строку по 2 символа за раз для разбора строки, отформатированной как "+c-R+D-E" (есть несколько дополнительных букв).

Я закончил с этим, который работает, но выглядит уродливо. Я закончил тем, что комментировал то, что он делал, потому что это казалось неочевидным. Это почти кажется питоническим, но не совсем.

# Might not be exact, but you get the idea, use the step
# parameter of range() and slicing to grab 2 chars at a time
s = "+c-R+D-e"
for op, code in (s[i:i+2] for i in range(0, len(s), 2)):
  print op, code

Существуют ли лучшие / более чистые способы сделать это?

Ответы [ 12 ]

46 голосов
/ 22 июля 2009

Не знаю про уборщик, но есть другая альтернатива:

for (op, code) in zip(s[0::2], s[1::2]):
    print op, code

Версия без копии:

from itertools import izip, islice
for (op, code) in izip(islice(s, 0, None, 2), islice(s, 1, None, 2)):
    print op, code
13 голосов
/ 22 июля 2009

Может быть, это будет чище?

s = "+c-R+D-e"
for i in xrange(0, len(s), 2):
    op, code = s[i:i+2]
    print op, code

Возможно, вы могли бы написать генератор, чтобы делать то, что вы хотите, может быть, это было бы более питонным:)

5 голосов
/ 22 июля 2009

Триптих вдохновил это более общее решение:

def slicen(s, n, truncate=False):
    assert n > 0
    while len(s) >= n:
        yield s[:n]
        s = s[n:]
    if len(s) and not truncate:
        yield s

for op, code in slicen("+c-R+D-e", 2):
    print op,code
4 голосов
/ 22 июля 2009
from itertools import izip_longest
def grouper(iterable, n, fillvalue=None):
    args = [iter(iterable)] * n
    return izip_longest(*args, fillvalue=fillvalue)
def main():
    s = "+c-R+D-e"
    for item in grouper(s, 2):
        print ' '.join(item)
if __name__ == "__main__":
    main()
##output
##+ c
##- R
##+ D
##- e

izip_longest требует Python 2.6 (или выше). Если на Python 2.4 или 2.5, используйте определение для izip_longest из документа или измените функцию группирования на:

from itertools import izip, chain, repeat
def grouper(iterable, n, padvalue=None):
    return izip(*[chain(iterable, repeat(padvalue, n-1))]*n)
3 голосов
/ 22 июля 2009

Отличная возможность для генератора. Для больших списков это будет гораздо эффективнее, чем архивирование любого другого элемента. Обратите внимание, что эта версия также обрабатывает строки с висячими op s

def opcodes(s):
    while True:
        try:
            op   = s[0]
            code = s[1]
            s    = s[2:]
        except IndexError:
            return
        yield op,code        


for op,code in opcodes("+c-R+D-e"):
   print op,code

edit: незначительная перезапись, чтобы избежать исключений ValueError.

2 голосов
/ 31 октября 2013

Этот подход поддерживает произвольное количество элементов на результат, оценивает лениво, и итеративный ввод может быть генератором (индексация не предпринимается):

import itertools

def groups_of_n(n, iterable):
    c = itertools.count()
    for _, gen in itertools.groupby(iterable, lambda x: c.next() / n):
        yield gen

Все оставшиеся элементы возвращаются в более коротком списке.

Пример использования:

for g in groups_of_n(4, xrange(21)):
    print list(g)

[0, 1, 2, 3]
[4, 5, 6, 7]
[8, 9, 10, 11]
[12, 13, 14, 15]
[16, 17, 18, 19]
[20]
2 голосов
/ 22 июля 2009

Другие ответы хорошо работают при n = 2, но для общего случая вы можете попробовать это:

def slicen(s, n, truncate=False):
    nslices = len(s) / n
    if not truncate and (len(s) % n):
        nslices += 1
    return (s[i*n:n*(i+1)] for i in range(nslices))

>>> s = '+c-R+D-e'
>>> for op, code in slicen(s, 2):
...     print op, code
... 
+ c
- R
+ D
- e

>>> for a, b, c in slicen(s, 3):
...     print a, b, c
... 
+ c -
R + D
Traceback (most recent call last):
  File "<stdin>", line 1, in ?
ValueError: need more than 2 values to unpack

>>> for a, b, c in slicen(s,3,True):
...     print a, b, c
... 
+ c -
R + D
1 голос
/ 22 июля 2009

Возможно, не самый эффективный, но если вы любите регулярные выражения ...

import re
s = "+c-R+D-e"
for op, code in re.findall('(.)(.)', s):
    print op, code
1 голос
/ 22 июля 2009
>>> s = "+c-R+D-e"
>>> s
'+c-R+D-e'
>>> s[::2]
'+-+-'
>>>
0 голосов
/ 03 декабря 2016

Рассмотрим pip установку more_itertools, которая уже поставляется с реализацией chunked вместе с другими полезными инструментами:

import more_itertools 

for op, code in more_itertools.chunked(s, 2):
    print(op, code)

Выход:

+ c
- R
+ D
- e
...