Как генерировать перестановки списка без "обратных дубликатов" в Python с использованием генераторов - PullRequest
8 голосов
/ 07 июня 2009

Это связано с вопросом Как сгенерировать все перестановки списка в Python

Как создать все перестановки, которые соответствуют следующим критериям : , если две перестановки противоположны друг другу (то есть [1,2,3,4] и [4,3,2,1 ]), они считаются равными, и только один из них должен быть в конечном результате .

Пример:

permutations_without_duplicates ([1,2,3])
[1, 2, 3]
[1, 3, 2]
[2, 1, 3]

Я переставляю списки, содержащие уникальные целые числа.

Количество результирующих перестановок будет большим, поэтому я бы хотел использовать генераторы Python, если это возможно.

Редактировать: Я бы не хотел сохранять список всех перестановок в памяти, если это возможно.

Ответы [ 10 ]

11 голосов
/ 07 июня 2009

Если вы генерируете перестановки в лексикографическом порядке, вам не нужно ничего хранить, чтобы понять, была ли уже видна обратная сторона данной перестановки. Вам просто нужно сравнить его с лексикографически и наоборот - если он меньше, вернуть его, если он больше, пропустить.

Вероятно, есть более эффективный способ сделать это, но он прост и имеет свойства, которые вам требуются (реализуется как генератор, использует O (n) рабочей памяти).

9 голосов
/ 31 декабря 2009

У меня есть чудесное продолжение предложения SilentGhost - размещение отдельного ответа, поскольку поля комментария будут слишком узкими, чтобы содержать код: -)

itertools.permutations встроено (с версии 2.6) и быстро. Нам просто нужно условие фильтрации, чтобы каждый (perm, perm [:: - 1]) принимал ровно одно из них. Поскольку ОП говорит, что элементы всегда различны, мы можем просто сравнить любые 2 элемента:

for p in itertools.permutations(range(3)):
    if p[0] < p[-1]:
        print p

который печатает:

(0, 1, 2)
(0, 2, 1)
(1, 0, 2)

Это работает, потому что обратная перестановка всегда переворачивает отношение!
p[0] < p[1] или любая другая пара также будет работать, так что вы также можете контролировать, какую половину перестановок вы получите.

Я не уверен, есть ли более эффективный способ фильтрации. itertools.permutations гарантирует лексикографический порядок, но лексикографические позиции p и p[::-1] связаны довольно сложным образом. В частности, просто остановка в середине не работает.

Но я подозреваю (не проверял), что встроенный итератор с фильтрацией 2: 1 превзойдет любую пользовательскую реализацию. И, конечно же, выигрывает в простоте!

3 голосов
/ 07 июня 2009

Это более краткая и быстрая версия принятого ответа ChristopheD, которая мне очень понравилась. Рекурсия отличная. Я установил уникальность входящего списка, удалив дубликаты, однако, возможно, вместо этого следует просто вызвать исключение.

def fac(x): 
    return (1 if x==0 else x * fac(x-1))

def permz(plist):
    plist = sorted(set(plist))
    plen = len(plist)
    limit = fac(plen) / 2
    counter = 0
    if plen==1:
        yield plist
    else:
        for perm in permz(plist[1:]):
            for i in xrange(plen):
                if counter == limit:
                     raise StopIteration
                counter += 1
                yield perm[:i] + plist[0:1] + perm[i:]

# ---- testing ----
plists = [
    list('love'),
    range(5),
    [1,4,2,3,9],
    ['a',2,2.1],
    range(8)]               

for plist in plists:
    perms = list(permz(plist))
    print plist, True in [(list(reversed(i)) in foo) for i in perms]
3 голосов
/ 07 июня 2009

РЕДАКТИРОВАТЬ : полностью изменено, чтобы сохранить все как генератор (никогда не весь список в памяти). Должен удовлетворять требованиям (рассчитывает только половину возможных перестановок (не наоборот). EDIT2 : добавлена ​​более короткая (и более простая) факторная функция из здесь .

EDIT3: : (см. Комментарии) - версию с улучшениями можно найти в версии bwopah .

def fac(x): 
    return (1 if x==0 else x * fac(x-1))

def all_permutations(plist):
    global counter

    if len(plist) <=1:
        yield plist
    else:
        for perm in all_permutations(plist[1:]):
            for i in xrange(len(perm)+1):
                if len(perm[:i] + plist[0:1] + perm[i:]) == lenplist:
                        if counter == limit:
                             raise StopIteration
                        else:
                             counter = counter + 1
                yield perm[:i] + plist[0:1] + perm[i:]

counter = 0
plist = ['a','b','c']
lenplist = len(plist)
limit = fac(lenplist) / 2

all_permutations_gen = all_permutations(plist)
print all_permutations_gen
print list(all_permutations_gen)
2 голосов
/ 08 июня 2009

Вот моя реализация:

a = [1,2,3,4]

def p(l):
  if len(l) <= 1:
    yield l
  else:
    for i in range(len(l)):
      for q in p([l[j] for j in range(len(l)) if j != i]):
        yield [l[i]] + q

out = (i for i in p(a) if i < i[::-1])

Функция P - это обычная функция permu, которая предоставляет все возможности. Фильтр выполняется, когда повторяется результат. Просто у этого есть два возможных результата, меньшая половина всей перми и большая половина перми. В этом примере out содержит меньшую половину списка.

2 голосов
/ 07 июня 2009

Вот код, который делает трюк. Чтобы избавиться от дубликатов, я заметил, что для вашего списка, если значение первого местоположения больше, чем значение последнего местоположения, то это будет дублирование. Я создаю карту, чтобы отслеживать, где каждый элемент находился в списке для начала, а затем использую эту карту для проведения теста. Код также не использует рекурсию, поэтому он сохраняет небольшой объем памяти. Также в списке могут быть элементы любого типа, а не только цифры, см. Последние два теста.

Вот код.

class Permutation:
    def __init__(self, justalist):
        self._data = justalist[:]
        self._len=len(self._data)
        self._s=[]
        self._nfact=1
        self._map ={}
        i=0
        for elem in self._data:
            self._s.append(elem)
            self._map[str(elem)]=i
            i+=1
            self._nfact*=i
        if i != 0:
            self._nfact2=self._nfact//i

    def __iter__(self):
        for k in range(self._nfact):
            for i in range(self._len):
                self._s[i]=self._data[i]
            s=self._s
            factorial=self._nfact2
            for i in range(self._len-1):
                tempi = (k // factorial) % (self._len - i)
                temp = s[i + tempi]
                for j in range(i + tempi,i,-1):
                    s[j] = s[j-1]
                s[i] = temp
                factorial //= (self._len - (i + 1))

            if self._map[str(s[0])] < self._map[str(s[-1])]:
                yield s




s=[1,2]
print("_"*25)
print("input list:",s)
for sx in Permutation(s):
    print(sx)

s=[1,2,3]
print("_"*25)
print("input list:",s)
for sx in Permutation(s):
    print(sx)

s=[1,2,3,4]
print("_"*25)
print("input list:",s)
for sx in Permutation(s):
    print(sx)

s=[3,2,1]
print("_"*25)
print("input list:",s)
for sx in Permutation(s):
    print(sx)

s=["Apple","Pear","Orange"]
print("_"*25)
print("input list:",s)
for sx in Permutation(s):
    print(sx)

s=[[1,4,5],"Pear",(1,6,9),Permutation([])]
print("_"*25)
print("input list:",s)
for sx in Permutation(s):
    print(sx)

и вот вывод для моих тестовых случаев.

_________________________
input list: [1, 2]
[1, 2]
_________________________
input list: [1, 2, 3]
[1, 2, 3]
[1, 3, 2]
[2, 1, 3]
_________________________
input list: [1, 2, 3, 4]
[1, 2, 3, 4]
[1, 2, 4, 3]
[1, 3, 2, 4]
[1, 3, 4, 2]
[1, 4, 2, 3]
[1, 4, 3, 2]
[2, 1, 3, 4]
[2, 1, 4, 3]
[2, 3, 1, 4]
[2, 4, 1, 3]
[3, 1, 2, 4]
[3, 2, 1, 4]
_________________________
input list: [3, 2, 1]
[3, 2, 1]
[3, 1, 2]
[2, 3, 1]
_________________________
input list: ['Apple', 'Pear', 'Orange']
['Apple', 'Pear', 'Orange']
['Apple', 'Orange', 'Pear']
['Pear', 'Apple', 'Orange']
_________________________
input list: [[1, 4, 5], 'Pear', (1, 6, 9), <__main__.Permutation object at 0x0142DEF0>]
[[1, 4, 5], 'Pear', (1, 6, 9), <__main__.Permutation object at 0x0142DEF0>]
[[1, 4, 5], 'Pear', <__main__.Permutation object at 0x0142DEF0>, (1, 6, 9)]
[[1, 4, 5], (1, 6, 9), 'Pear', <__main__.Permutation object at 0x0142DEF0>]
[[1, 4, 5], (1, 6, 9), <__main__.Permutation object at 0x0142DEF0>, 'Pear']
[[1, 4, 5], <__main__.Permutation object at 0x0142DEF0>, 'Pear', (1, 6, 9)]
[[1, 4, 5], <__main__.Permutation object at 0x0142DEF0>, (1, 6, 9), 'Pear']
['Pear', [1, 4, 5], (1, 6, 9), <__main__.Permutation object at 0x0142DEF0>]
['Pear', [1, 4, 5], <__main__.Permutation object at 0x0142DEF0>, (1, 6, 9)]
['Pear', (1, 6, 9), [1, 4, 5], <__main__.Permutation object at 0x0142DEF0>]
['Pear', <__main__.Permutation object at 0x0142DEF0>, [1, 4, 5], (1, 6, 9)]
[(1, 6, 9), [1, 4, 5], 'Pear', <__main__.Permutation object at 0x0142DEF0>]
[(1, 6, 9), 'Pear', [1, 4, 5], <__main__.Permutation object at 0x0142DEF0>]
2 голосов
/ 07 июня 2009

Как насчет этого:

from itertools import permutations

def rev_generator(plist):
    reversed_elements = set()
    for i in permutations(plist):
        if i not in reversed_elements:
            reversed_i = tuple(reversed(i))
            reversed_elements.add(reversed_i)
            yield i

>>> list(rev_generator([1,2,3]))
[(1, 2, 3), (1, 3, 2), (2, 1, 3)]

Кроме того, если возвращаемое значение должно быть списком, вы можете просто изменить yield i на yield list (i), но для целей итерации кортежи будут работать очень хорошо.

1 голос
/ 07 июня 2009

Сначала код установки:

try:
    from itertools import permutations
except ImportError:
    # straight from http://docs.python.org/library/itertools.html#itertools.permutations
    def permutations(iterable, r=None):
        # permutations('ABCD', 2) --> AB AC AD BA BC BD CA CB CD DA DB DC
        # permutations(range(3)) --> 012 021 102 120 201 210
        pool = tuple(iterable)
        n = len(pool)
        r = n if r is None else r
        if r > n:
            return
        indices = range(n)
        cycles = range(n, n-r, -1)
        yield tuple(pool[i] for i in indices[:r])
        while n:
            for i in reversed(range(r)):
                cycles[i] -= 1
                if cycles[i] == 0:
                    indices[i:] = indices[i+1:] + indices[i:i+1]
                    cycles[i] = n - i
                else:
                    j = cycles[i]
                    indices[i], indices[-j] = indices[-j], indices[i]
                    yield tuple(pool[i] for i in indices[:r])
                    break
            else:
                return

def non_reversed_permutations(iterable):
    "Return non-reversed permutations for an iterable with unique items"
    for permutation in permutations(iterable):
        if permutation[0] < permutation[-1]:
            yield permutation
1 голос
/ 07 июня 2009

это реализация чьего-то предложения

от http://en.wikipedia.org/wiki/Permutation#Lexicographical_order_generation Следующий алгоритм генерирует следующую перестановку лексикографически после данной перестановки. Изменяет данную перестановку на месте.

  1. Найдите самый высокий индекс i такой, что s [i] Найдите самый высокий индекс j> i такой, что s [j]> s [i]. Такой j должен существовать, так как i + 1 такой индекс.
  2. Поменяйте местами s [i] с s [j].
  3. Обратный порядок всех элементов после индекса i

функция:

def perms(items):
    items.sort()
    yield items[:]
    m = [len(items)-2]  # step 1
    while m:
        i = m[-1]
        j = [ j for j in range(i+1,len(items)) if items[j]>items[i] ][-1] # step 2
        items[i], items[j] = items[j], items[i] # step 3
        items[i+1:] = list(reversed(items[i+1:])) # step 4
        if items<list(reversed(items)):
            yield items[:]
        m = [ i for i in range(len(items)-1) if items[i]<items[i+1] ]  # step 1

проверка нашей работы:

>>> foo=list(perms([1,3,2,4,5]))
>>> True in [(list(reversed(i)) in foo) for i in foo]
False
0 голосов
/ 07 июня 2009

itertools.permutations делает именно то, что вы хотите. Вы можете использовать reversed встроенный , а также

...