Question

В Python, как можно вычесть два неуникальных неупорядоченных списка? Скажем, у нас есть a = [0,1,2,1,0] и b = [0, 1, 1] Я хотел бы сделать что-то вроде c = a - b и иметь c be [2, 0] или [0, 2] порядок, для меня не имеет значения. Это должно вызвать исключение, если a не содержит все элементы в b.

Обратите внимание, что это отличается от наборов! Меня не интересует различие наборов элементов в a и b, меня интересует различие между фактическими наборами элементов в a и б.

Я могу сделать это с помощью цикла for, отыскивая первый элемент b в a, а затем удаляя элемент из b и из a и т. Д. Но это мне не нравится, это будет очень неэффективно (порядок O(n^2) времени), в то время как это не должно быть проблемой, чтобы сделать это в O(n log n) времени.

Dyno Fu · Answer 1 · 15 января 2010

Я знаю, что "для" это не то, что вы хотите, но это просто и понятно:

for x in b:
  a.remove(x)

Или, если члены b могут отсутствовать в a, используйте:

for x in b:
  if x in a:
    a.remove(x)

Dave Kirby · Answer 2 · 15 января 2010

Python 2.7 и 3.2 добавит класс collection.Counter , который представляет собой словарь, который отображает элементы на количество вхождений элемента. Это можно использовать как мультимножество.

Согласно документации, вы должны иметь возможность сделать что-то подобное (не проверено, поскольку у меня не установлена ни одна из версий).

from collections import Counter
a = Counter(0,1,2,1)
b = Counter(0,1,1)

print a - b  # ignores items in b missing in a

# check every element in a is in b
# a[key] returns 0 if key not in a, instead of raising an exception
assert all(a[key] > b[key] for key in b)

Редактировать

Так как вы застряли в 2.5, вы можете попробовать импортировать его и определить свою собственную версию, если это не удастся. Таким образом, вы будете уверены, что получите последнюю версию, если она доступна, и вернитесь к рабочей версии, если нет. Вы также выиграете от повышения скорости, если в будущем преобразуетесь в реализацию языка Си.

т.е.

try:
   from collections import Counter
except ImportError:
    class Counter(dict):
       ...

Вы можете найти текущий источник Python здесь .

pcv · Answer 3 · 08 мая 2010

Я бы сделал это проще:

a_b = [e for e in a if not e in b ]

.. как написано, это неправильно - работает, только если элементы уникальны в списках. И если они есть, то лучше использовать

a_b = list(set(a) - set(b))

jkp · Answer 4 · 15 января 2010

Я не уверен, что возражает против цикла for: в Python нет мультисета, поэтому вы не можете использовать встроенный контейнер, чтобы выручить вас.

Мне кажется, что-нибудь в одной строке (если возможно), вероятно, будет чрезвычайно сложно понять. Перейти на удобочитаемость и поцелуй. Python не C:)

ephemient · Answer 5 · 19 января 2010

Python 2.7+ и 3.0 имеют коллекций. Счетчик (многократный набор данных). Документация ссылается на Рецепт 576611: класс счетчика для Python 2.5:

from operator import itemgetter
from heapq import nlargest
from itertools import repeat, ifilter

class Counter(dict):
    '''Dict subclass for counting hashable objects.  Sometimes called a bag
    or multiset.  Elements are stored as dictionary keys and their counts
    are stored as dictionary values.

    >>> Counter('zyzygy')
    Counter({'y': 3, 'z': 2, 'g': 1})

    '''

    def __init__(self, iterable=None, **kwds):
        '''Create a new, empty Counter object.  And if given, count elements
        from an input iterable.  Or, initialize the count from another mapping
        of elements to their counts.

        >>> c = Counter()                           # a new, empty counter
        >>> c = Counter('gallahad')                 # a new counter from an iterable
        >>> c = Counter({'a': 4, 'b': 2})           # a new counter from a mapping
        >>> c = Counter(a=4, b=2)                   # a new counter from keyword args

        '''        
        self.update(iterable, **kwds)

    def __missing__(self, key):
        return 0

    def most_common(self, n=None):
        '''List the n most common elements and their counts from the most
        common to the least.  If n is None, then list all element counts.

        >>> Counter('abracadabra').most_common(3)
        [('a', 5), ('r', 2), ('b', 2)]

        '''        
        if n is None:
            return sorted(self.iteritems(), key=itemgetter(1), reverse=True)
        return nlargest(n, self.iteritems(), key=itemgetter(1))

    def elements(self):
        '''Iterator over elements repeating each as many times as its count.

        >>> c = Counter('ABCABC')
        >>> sorted(c.elements())
        ['A', 'A', 'B', 'B', 'C', 'C']

        If an element's count has been set to zero or is a negative number,
        elements() will ignore it.

        '''
        for elem, count in self.iteritems():
            for _ in repeat(None, count):
                yield elem

    # Override dict methods where the meaning changes for Counter objects.

    @classmethod
    def fromkeys(cls, iterable, v=None):
        raise NotImplementedError(
            'Counter.fromkeys() is undefined.  Use Counter(iterable) instead.')

    def update(self, iterable=None, **kwds):
        '''Like dict.update() but add counts instead of replacing them.

        Source can be an iterable, a dictionary, or another Counter instance.

        >>> c = Counter('which')
        >>> c.update('witch')           # add elements from another iterable
        >>> d = Counter('watch')
        >>> c.update(d)                 # add elements from another counter
        >>> c['h']                      # four 'h' in which, witch, and watch
        4

        '''        
        if iterable is not None:
            if hasattr(iterable, 'iteritems'):
                if self:
                    self_get = self.get
                    for elem, count in iterable.iteritems():
                        self[elem] = self_get(elem, 0) + count
                else:
                    dict.update(self, iterable) # fast path when counter is empty
            else:
                self_get = self.get
                for elem in iterable:
                    self[elem] = self_get(elem, 0) + 1
        if kwds:
            self.update(kwds)

    def copy(self):
        'Like dict.copy() but returns a Counter instance instead of a dict.'
        return Counter(self)

    def __delitem__(self, elem):
        'Like dict.__delitem__() but does not raise KeyError for missing values.'
        if elem in self:
            dict.__delitem__(self, elem)

    def __repr__(self):
        if not self:
            return '%s()' % self.__class__.__name__
        items = ', '.join(map('%r: %r'.__mod__, self.most_common()))
        return '%s({%s})' % (self.__class__.__name__, items)

    # Multiset-style mathematical operations discussed in:
    #       Knuth TAOCP Volume II section 4.6.3 exercise 19
    #       and at http://en.wikipedia.org/wiki/Multiset
    #
    # Outputs guaranteed to only include positive counts.
    #
    # To strip negative and zero counts, add-in an empty counter:
    #       c += Counter()

    def __add__(self, other):
        '''Add counts from two counters.

        >>> Counter('abbb') + Counter('bcc')
        Counter({'b': 4, 'c': 2, 'a': 1})


        '''
        if not isinstance(other, Counter):
            return NotImplemented
        result = Counter()
        for elem in set(self) | set(other):
            newcount = self[elem] + other[elem]
            if newcount > 0:
                result[elem] = newcount
        return result

    def __sub__(self, other):
        ''' Subtract count, but keep only results with positive counts.

        >>> Counter('abbbc') - Counter('bccd')
        Counter({'b': 2, 'a': 1})

        '''
        if not isinstance(other, Counter):
            return NotImplemented
        result = Counter()
        for elem in set(self) | set(other):
            newcount = self[elem] - other[elem]
            if newcount > 0:
                result[elem] = newcount
        return result

    def __or__(self, other):
        '''Union is the maximum of value in either of the input counters.

        >>> Counter('abbb') | Counter('bcc')
        Counter({'b': 3, 'c': 2, 'a': 1})

        '''
        if not isinstance(other, Counter):
            return NotImplemented
        _max = max
        result = Counter()
        for elem in set(self) | set(other):
            newcount = _max(self[elem], other[elem])
            if newcount > 0:
                result[elem] = newcount
        return result

    def __and__(self, other):
        ''' Intersection is the minimum of corresponding counts.

        >>> Counter('abbb') & Counter('bcc')
        Counter({'b': 1})

        '''
        if not isinstance(other, Counter):
            return NotImplemented
        _min = min
        result = Counter()
        if len(self) < len(other):
            self, other = other, self
        for elem in ifilter(self.__contains__, other):
            newcount = _min(self[elem], other[elem])
            if newcount > 0:
                result[elem] = newcount
        return result


if __name__ == '__main__':
    import doctest
    print doctest.testmod()

Тогда вы можете написать

 a = Counter([0,1,2,1,0])
 b = Counter([0, 1, 1])
 c = a - b
 print list(c.elements())  # [0, 2]

BlackShift · Answer 6 · 15 января 2010

для использования понимания списка:

[i for i in a if not i in b or b.remove(i)]

сделает трюк. Это изменило бы b в процессе все же. Но я согласен с jkp и Dyno Fu, что использование цикла for было бы лучше.

Может быть, кто-то может создать лучший пример, который использует понимание списка, но все еще KISS?

BlackShift · Answer 7 · 15 января 2010

Чтобы доказать точку зрения jkp, что «что-то в одной строке, вероятно, будет чрезвычайно сложно понять», я создал однострочник. Пожалуйста, не изменяйте мне, потому что я понимаю, что это не решение, которое вы должны использовать. Это только для демонстрационных целей.

Идея состоит в том, чтобы добавлять значения по одному, при условии, что общее количество добавленных вами значений будет меньше, чем общее число раз, когда это значение равно минусу, сколько раз оно находится в b. :

[ value for counter,value in enumerate(a) if a.count(value) >= b.count(value) + a[counter:].count(value) ]

Ужас! Но, возможно, кто-то может улучшить это? Это даже без ошибок?

Редактировать: Увидев комментарий Девина Жанпьера об использовании словарной структуры данных, я придумала этот oneliner:

sum([ [value]*count for value,count in {value:a.count(value)-b.count(value) for value in set(a)}.items() ], [])

Лучше, но все еще нечитаемо.

Bex · Answer 8 · 01 марта 2016

Вы можете использовать конструкцию map, чтобы сделать это. Это выглядит вполне нормально, но имейте в виду, что строка map сама вернет список None s.

a = [1, 2, 3]
b = [2, 3]

map(lambda x:a.remove(x), b)
a

JoeCondron · Answer 9 · 24 декабря 2014

Вот довольно длинное, но эффективное и удобочитаемое решение. Это O (n).

def list_diff(list1, list2):
    counts = {}
    for x in list1:
        try:
            counts[x] += 1
        except:
            counts[x] = 1
    for x in list2:
        try:
            counts[x] -= 1
            if counts[x] < 0:
                raise ValueError('All elements of list2 not in list2')
        except:
            raise ValueError('All elements of list2 not in list1') 
    result = []
    for k, v in counts.iteritems():
        result += v*[k] 
    return result

a = [0, 1, 1, 2, 0]
b = [0, 1, 1]
%timeit list_diff(a, b)
%timeit list_diff(1000*a, 1000*b)
%timeit list_diff(1000000*a, 1000000*b)
100000 loops, best of 3: 4.8 µs per loop
1000 loops, best of 3: 1.18 ms per loop
1 loops, best of 3: 1.21 s per loop

Вычитание двух списков в Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 13 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Вычитание двух списков в Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 13 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов