Замените повторяющиеся элементы из списка, сохраняя первое вхождение - PullRequest
0 голосов
/ 04 января 2019

У меня есть список lst = [1,1,1,2,2,2,2,3,3,3,3,3,4,4,4,4,4,4,4,4,4]

Я ожидаю следующий вывод:

out = [1,"","",2,"","","",3,"","","","",4,"","","","","","","",""]

Я хочу сохранить первое вхождение элемента и заменить все остальные вхождения этого элемента пустыми строками.

Я попробовал следующий подход.

`def splrep(lst):
    from collections import Counter
    C = Counter(lst)
    flst = [ [k,]*v for k,v in C.items()]
    nl = []
    for i in flst:
        nl1 = []
        for j,k in enumerate(i):
            nl1.append(j)
        nl.append(nl1)

    ng = list(zip(flst, nl))
    for i,j in ng:
        j.pop(0)
    for i,j in ng:
        for k in j:
            i[k] = ''
    final = [i for [i,j] in ng]
    fin = [i for j in final for i in j]
    return fin`

Но я ищу более простые или лучшие подходы.

Ответы [ 7 ]

0 голосов
/ 04 января 2019

Вы можете попробовать подход ниже.

lst = [1,1,1,2,2,2,2,3,3,3,3,3,4,4,4,4,4,4,4,4,4]
fin=[]
for each in lst:
   if each not in fin:
       fin.append(each)
   else:
       fin.append("")
print(fin)
0 голосов
/ 04 января 2019

Вы можете сохранить первые вхождения в словаре с помощью dict.setdefault(), а затем сохранить первые найденные числа в зависимости от того, существуют ли они в этом словаре:

lst = [1,1,1,2,2,2,2,3,3,3,3,3,4,4,4,4,4,4,4,4,4]

first_indices = {}
for i, x in enumerate(lst):
    first_indices.setdefault(x, i)

result = [x if first_indices[x] == i else "" for i, x in enumerate(lst)]

print(result)
# [1, '', '', 2, '', '', '', 3, '', '', '', '', 4, '', '', '', '', '', '', '', '']
0 голосов
/ 04 января 2019

Краткое решение (однострочное) без использования каких-либо модулей выглядит следующим образом:

lst = [1,1,1,2,2,2,2,3,3,3,3,3,4,4,4,4,4,4,4,4,4]
out = ["" if (i in lst[:inx]) else i for inx,i in enumerate(lst)]
print(out)

выход

[1, '', '', 2, '', '', '', 3, '', '', '', '', 4, '', '', '', '', '', '', '', '']
0 голосов
/ 04 января 2019

Сделайте это, если вы не хотите использовать set или itertools:

lst = [1,1,1,2,2,2,2,3,3,3,3,3,4,4,4,4,4,4,4,4,4]

new_lst = []

for i in lst:
    if i in new_lst:
        new_lst.append("")
    else:
        new_lst.append(i)

print(new_lst)        

Выход:

[1, '', '', 2, '', '', '', 3, '', '', '', '', 4, '', '', '', '', '', '', '', '']
0 голосов
/ 04 января 2019

Использование простой итерации

Ex:

lst = [1,1,1,2,2,2,2,3,3,3,3,3,4,4,4,4,4,4,4,4,4]
dup_check = set()
result = []
for i in lst:
    if i not in dup_check:
        result.append(i)
        dup_check.add(i)
    else:
        result.append("")
print(result)

Выход:

[1, '', '', 2, '', '', '', 3, '', '', '', '', 4, '', '', '', '', '', '', '', '']
0 голосов
/ 04 января 2019

Используйте itertools.groupby, что вполне подходит для группировки последовательно повторяющихся значений.

from itertools import groupby
[v for k, g in groupby(lst) for v in [k] + [""] * (len(list(g))-1)]
# [1, '', '', 2, '', '', '', 3, '', '', '', '', 4, '', '', '', '', '', '', '', '']

Если значения в списке не являются последовательными, вы можете сначала отсортировать их.

0 голосов
/ 04 января 2019

Попробуйте эту более простую функцию:

def fill_blank(l):
    filled = []
    last = l[0]
    for i in l:
        if i != last:
            last = i
        filled.append(last)
    return filled

Используйте это так:

>>> lst = [1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4, 4]
>>> out = fill_blank(lst)
>>> print(out)
[1, '', '', 2, '', '', '', 3, '', '', '', '', 4, '', '', '', '', '', '', '', '']
...