Question

У меня есть список с повторяющимися элементами:

 list_a=[1,2,3,5,6,7,5,2]

 tmp=[]

 for i in list_a:
     if tmp.__contains__(i):
         print i
     else:
         tmp.append(i)

Я использовал приведенный выше код для поиска дублирующихся элементов в list_a. Я не хочу удалять элементы из списка.

Но я хочу использовать здесь цикл. Обычно C / C ++ мы используем следующим образом:

 for (int i=0;i<=list_a.length;i++)
     for (int j=i+1;j<=list_a.length;j++)
         if (list_a[i]==list_a[j])
             print list_a[i]

как мы используем это в Python?

for i in list_a:
    for j in list_a[1:]:
    ....

Я попробовал вышеуказанный код. Но это неверное решение. Я не знаю, как увеличить значение для j.

YOU · Answer 1 · 17 декабря 2009

Только для информации, в python 2.7+ мы можем использовать Counter

import collections

x=[1, 2, 3, 5, 6, 7, 5, 2]

>>> x
[1, 2, 3, 5, 6, 7, 5, 2]

>>> y=collections.Counter(x)
>>> y
Counter({2: 2, 5: 2, 1: 1, 3: 1, 6: 1, 7: 1})

Уникальный список

>>> list(y)
[1, 2, 3, 5, 6, 7]

Товаров найдено более 1 раза

>>> [i for i in y if y[i]>1]
[2, 5]

Предметы найдены только один раз

>>> [i for i in y if y[i]==1]
[1, 3, 6, 7]

Miguel A. Friginal · Answer 2 · 17 декабря 2009

Используйте оператор in вместо прямого вызова __contains__.

То, что у вас почти работает (но O (n ** 2)):

for i in xrange(len(list_a)):
  for j in xrange(i + 1, len(list_a)):
    if list_a[i] == list_a[j]:
      print "duplicate:", list_a[i]

Но гораздо проще использовать набор (примерно O (n) из-за хеш-таблицы):

seen = set()
for n in list_a:
  if n in seen:
    print "duplicate:", n
  else:
    seen.add(n)

Или дикт, если вы хотите отслеживать местоположения дубликатов (также O (n)):

import collections
items = collections.defaultdict(list)
for i, item in enumerate(list_a):
  items[item].append(i)
for item, locs in items.iteritems():
  if len(locs) > 1:
    print "duplicates of", item, "at", locs

Или даже просто где-то обнаружить дубликат (также O (n)):

if len(set(list_a)) != len(list_a):
  print "duplicate"

Evan Fosmark · Answer 3 · 17 декабря 2009

Вы всегда можете использовать понимание списка:

dups = [x for x in list_a if list_a.count(x) > 1]

e-satis · Answer 4 · 17 декабря 2009

До Python 2.3 используйте dict ():

>>> lst = [1, 2, 3, 5, 6, 7, 5, 2]
>>> stats = {}
>>> for x in lst : # count occurrences of each letter:
...     stats[x] = stats.get(x, 0) + 1 
>>> print stats
{1: 1, 2: 2, 3: 1, 5: 2, 6: 1, 7: 1} # filter letters appearing more than once:
>>> duplicates = [dup for (dup, i) in stats.items() if i > 1] 
>>> print duplicates

Итак, функция:

def getDuplicates(iterable):
    """
       Take an iterable and return a generator yielding its duplicate items.
       Items must be hashable.

       e.g :

       >>> sorted(list(getDuplicates([1, 2, 3, 5, 6, 7, 5, 2])))
       [2, 5]
    """
    stats = {}
    for x in iterable : 
        stats[x] = stats.get(x, 0) + 1
    return (dup for (dup, i) in stats.items() if i > 1)

С Python 2.3 поставляется set (), и он даже встроен после:

def getDuplicates(iterable):
    """
       Take an iterable and return a generator yielding its duplicate items.
       Items must be hashable.

       e.g :

       >>> sorted(list(getDuplicates([1, 2, 3, 5, 6, 7, 5, 2])))
       [2, 5]
    """
    try: # try using built-in set
        found = set() 
    except NameError: # fallback on the sets module
        from sets import Set
        found = Set()

    for x in iterable:
        if x in found : # set is a collection that can't contain duplicate
            yield x
        found.add(x) # duplicate won't be added anyway

В Python 2.7 и выше у вас есть модуль collections, обеспечивающий ту же функцию, что и dict , и мы можем сделать его короче (и быстрее, вероятно, C под капотом), чем решение 1:

import collections

def getDuplicates(iterable):
    """
       Take an iterable and return a generator yielding its duplicate items.
       Items must be hashable.

       e.g :

       >>> sorted(list(getDuplicates([1, 2, 3, 5, 6, 7, 5, 2])))
       [2, 5]
    """
    return (dup for (dup, i) in collections.counter(iterable).items() if i > 1)

Я бы придерживался решения 2.

HOT · Answer 5 · 26 июня 2012

Вы можете использовать эту функцию для поиска дубликатов:

def get_duplicates(arr):
    dup_arr = arr[:]
    for i in set(arr):
        dup_arr.remove(i)       
    return list(set(dup_arr))

Примеры

print get_duplicates([1,2,3,5,6,7,5,2])

[2, 5]

print get_duplicates([1,2,1,3,4,5,4,4,6,7,8,2])

[1, 2, 4]

Alok Singhal · Answer 6 · 17 декабря 2009

Если вы ищете взаимно-однозначное отображение между вложенными циклами и Python, вот что вам нужно:

n = len(list_a)
for i in range(n):
    for j in range(i+1, n):
        if list_a[i] == list_a[j]:
            print list_a[i]

Код выше не "Pythonic". Я бы сделал это примерно так:

seen = set()
for i in list_a:
   if i in seen:
       print i
   else:
       seen.add(i)

Кроме того, не используйте __contains__, скорее используйте in (как указано выше).

Zoran Pavlovic · Answer 7 · 28 января 2016

Использование только itertools и отлично работает на Python 2.5

from itertools import groupby
list_a = sorted([1, 2, 3, 5, 6, 7, 5, 2])
result = dict([(r, len(list(grp))) for r, grp in groupby(list_a)])

Результат:

{1: 1, 2: 2, 3: 1, 5: 2, 6: 1, 7: 1}

LeMiz · Answer 8 · 17 декабря 2009

Следующее требует, чтобы элементы вашего списка были хэшируемыми (а не просто реализующими __eq__). Я считаю более питонным использование defaultdict (и у вас есть количество повторений бесплатно):

import collections
l = [1, 2, 4, 1, 3, 3]
d = collections.defaultdict(int)
for x in l:
   d[x] += 1
print [k for k, v in d.iteritems() if v > 1]
# prints [1, 3]

Ahmer Kureishi · Answer 9 · 27 января 2013

Похоже, у вас есть список (list_a), который может включать в себя дубликаты, который вы бы предпочли сохранить как есть, и создать дедублированный список tmp на основе list_a. В Python 2.7 это можно сделать одной строкой:

tmp = list(set(list_a))

Сравнение длин tmp и list_a на этом этапе должно выяснить, действительно ли в list_a были повторяющиеся элементы. Это может помочь упростить вещи, если вы хотите пойти в цикл для дополнительной обработки.

Prince Vijay · Answer 10 · 09 июня 2019

Вы можете использовать:

b=['E', 'P', 'P', 'E', 'O', 'E']
c={}
for i in b:
    value=0
    for j in b:
        if(i == j):
            value+=1
            c[i]=value
print(c)

Выход:

{'E': 3, 'P': 2, 'O': 1}

Как найти повторяющиеся элементы в массиве, используя для цикла в Python?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 16 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Примеры

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как найти повторяющиеся элементы в массиве, используя для цикла в Python?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 16 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Примеры

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов