Найти пересечение двух вложенных списков? - PullRequest
464 голосов
/ 13 марта 2009

Я знаю, как получить пересечение двух плоских списков:

b1 = [1,2,3,4,5,9,11,15]
b2 = [4,5,6,7,8]
b3 = [val for val in b1 if val in b2]

или

def intersect(a, b):
    return list(set(a) & set(b))

print intersect(b1, b2)

Но когда мне нужно найти пересечение для вложенных списков, тогда начинаются мои проблемы:

c1 = [1, 6, 7, 10, 13, 28, 32, 41, 58, 63]
c2 = [[13, 17, 18, 21, 32], [7, 11, 13, 14, 28], [1, 5, 6, 8, 15, 16]]

В конце я хотел бы получить:

c3 = [[13,32],[7,13,28],[1,6]]

Не могли бы вы, ребята, помочь мне с этим?

Относящиеся

Ответы [ 18 ]

892 голосов
/ 13 марта 2009

Вам не нужно определять пересечение. Это уже первоклассная часть сета.

>>> b1 = [1,2,3,4,5,9,11,15]
>>> b2 = [4,5,6,7,8]
>>> set(b1).intersection(b2)
set([4, 5])
176 голосов
/ 13 марта 2009

Если вы хотите:

c1 = [1, 6, 7, 10, 13, 28, 32, 41, 58, 63]
c2 = [[13, 17, 18, 21, 32], [7, 11, 13, 14, 28], [1, 5, 6, 8, 15, 16]]
c3 = [[13, 32], [7, 13, 28], [1,6]]

Тогда вот ваше решение для Python 2:

c3 = [filter(lambda x: x in c1, sublist) for sublist in c2]

В Python 3 filter возвращает итерацию вместо list, поэтому вам нужно обернуть filter вызовы list():

c3 = [list(filter(lambda x: x in c1, sublist)) for sublist in c2]

Объяснение:

Часть фильтра берет элемент каждого подсписка и проверяет, находится ли он в списке источников c1. Понимание списка выполняется для каждого подсписка в c2.

59 голосов
/ 09 декабря 2009

Для людей, которые просто хотят найти пересечение двух списков, Аскер предоставил два метода:

b1 = [1,2,3,4,5,9,11,15]
b2 = [4,5,6,7,8]
b3 = [val for val in b1 if val in b2]

и

def intersect(a, b):
     return list(set(a) & set(b))

print intersect(b1, b2)

Но есть гибридный метод, который более эффективен, потому что вам нужно сделать только одно преобразование между списком / множеством, а не три:

b1 = [1,2,3,4,5]
b2 = [3,4,5,6]
s2 = set(b2)
b3 = [val for val in b1 if val in s2]

Это будет выполняться в O (n), тогда как его оригинальный метод, включающий понимание списка, будет выполняться в O (n ^ 2)

27 голосов
/ 10 сентября 2009

Функциональный подход:

input_list = [[1, 2, 3, 4, 5], [2, 3, 4, 5, 6], [3, 4, 5, 6, 7]]

result = reduce(set.intersection, map(set, input_list))

и может применяться к более общему случаю списков 1+

26 голосов
/ 13 марта 2009

Версия для понимания чистого списка

>>> c1 = [1, 6, 7, 10, 13, 28, 32, 41, 58, 63]
>>> c2 = [[13, 17, 18, 21, 32], [7, 11, 13, 14, 28], [1, 5, 6, 8, 15, 16]]
>>> c1set = frozenset(c1)

Сгладить вариант:

>>> [n for lst in c2 for n in lst if n in c1set]
[13, 32, 7, 13, 28, 1, 6]

Вложенный вариант:

>>> [[n for n in lst if n in c1set] for lst in c2]
[[13, 32], [7, 13, 28], [1, 6]]
21 голосов
/ 16 декабря 2016

Оператор & принимает пересечение двух множеств.

{1, 2, 3} & {2, 3, 4} Out [1]: {2, 3}

14 голосов
/ 27 января 2017

Питонический способ пересечения двух списков:

[x for x in list1 if x in list2]
8 голосов
/ 13 марта 2009

Вы должны использовать этот код (взят из http://kogs -www.informatik.uni-hamburg.de / ~ meine / python_tricks ), код не проверен, но я уверен, что он работы:


def flatten(x):
    """flatten(sequence) -> list

    Returns a single, flat list which contains all elements retrieved
    from the sequence and all recursively contained sub-sequences
    (iterables).

    Examples:
    >>> [1, 2, [3,4], (5,6)]
    [1, 2, [3, 4], (5, 6)]
    >>> flatten([[[1,2,3], (42,None)], [4,5], [6], 7, MyVector(8,9,10)])
    [1, 2, 3, 42, None, 4, 5, 6, 7, 8, 9, 10]"""

    result = []
    for el in x:
        #if isinstance(el, (list, tuple)):
        if hasattr(el, "__iter__") and not isinstance(el, basestring):
            result.extend(flatten(el))
        else:
            result.append(el)
    return result

После того, как вы сгладили список, вы выполняете пересечение обычным способом:


c1 = [1, 6, 7, 10, 13, 28, 32, 41, 58, 63]
c2 = [[13, 17, 18, 21, 32], [7, 11, 13, 14, 28], [1, 5, 6, 8, 15, 16]]

def intersect(a, b):
     return list(set(a) & set(b))

print intersect(flatten(c1), flatten(c2))

8 голосов
/ 21 февраля 2012

Поскольку определено intersect, достаточно базового понимания списка:

>>> c3 = [intersect(c1, i) for i in c2]
>>> c3
[[32, 13], [28, 13, 7], [1, 6]]

Улучшение благодаря замечанию С. Лотта и связанному с ним замечанию ТМ:

>>> c3 = [list(set(c1).intersection(i)) for i in c2]
>>> c3
[[32, 13], [28, 13, 7], [1, 6]]
5 голосов
/ 12 апреля 2014

Дано:

> c1 = [1, 6, 7, 10, 13, 28, 32, 41, 58, 63]

> c2 = [[13, 17, 18, 21, 32], [7, 11, 13, 14, 28], [1, 5, 6, 8, 15, 16]]

Я считаю, что следующий код работает хорошо и, возможно, более кратко при использовании операции set:

> c3 = [list(set(f)&set(c1)) for f in c2] 

Получено:

> [[32, 13], [28, 13, 7], [1, 6]]

При необходимости:

> c3 = [sorted(list(set(f)&set(c1))) for f in c2] 

мы получили:

> [[13, 32], [7, 13, 28], [1, 6]]

Кстати, для более питонского стиля это тоже хорошо:

> c3 = [ [i for i in set(f) if i in c1] for f in c2]
...