Question

Кто-нибудь может предложить хорошее решение для удаления дубликатов из вложенных списков, если вы хотите оценить дубликаты на основе первого элемента каждого вложенного списка?

Основной список выглядит так:

L = [['14', '65', 76], ['2', '5', 6], ['7', '12', 33], ['14', '22', 46]]

Если есть еще один список с таким же элементом в первой позиции [k][0], который уже имел место, то я хотел бы удалить этот список и получить такой результат:

L = [['14', '65', 76], ['2', '5', 6], ['7', '12', 33]]

Можете ли вы предложить алгоритм для достижения этой цели?

Brian · Answer 1 · 17 июля 2009

Вы заботитесь о сохранении заказа / какой дубликат удален? Если нет, то:

dict((x[0], x) for x in L).values()

сделает это. Если вы хотите сохранить порядок и хотите сохранить первый найденный, то:

def unique_items(L):
    found = set()
    for item in L:
        if item[0] not in found:
            yield item
            found.add(item[0])

print list(unique_items(L))

Jiaaro · Answer 2 · 17 июля 2009

вместо этого используйте dict:

L = {'14': ['65', 76], '2': ['5', 6], '7': ['12', 33]}
L['14'] = ['22', 46]

если вы получаете первый список из какого-либо внешнего источника, преобразуйте его следующим образом:

L = [['14', '65', 76], ['2', '5', 6], ['7', '12', 33], ['14', '22', 46]]
L_dict = dict((x[0], x[1:]) for x in L)

Rupert Schiessl · Answer 3 · 17 марта 2016

Используйте Панд:

import pandas as pd

L = [['14', '65', 76], ['2', '5', 6], ['7', '12', 33], ['14', '22', 46],['7','a','b']]

df = pd.DataFrame(L)
df = df.drop_duplicates()

L_no_duplicates = df.values.tolist()

Если вы хотите удалить дубликаты в определенных столбцах, используйте только вместо:

df = df.drop_duplicates([1,2])

rein · Answer 4 · 17 июля 2009

Если заказ не имеет значения, код ниже

print [ [k] + v for (k, v) in dict( [ [a[0], a[1:]] for a in reversed(L) ] ).items() ]

дает

[['2', '5', '6'], ['14', '65', '76'], ['7', '12', '33']]

ghostdog74 · Answer 5 · 17 июля 2009

Я не уверен, что вы имели в виду под "другим списком", поэтому я предполагаю, что вы говорите эти списки внутри L

a=[]
L = [['14', '65', 76], ['2', '5', 6], ['7', '12', 33], ['14', '22', 46],['7','a','b']]
for item in L:
    if not item[0] in a:
        a.append(item[0])
        print item

Удаление дубликатов из списка списков в Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 5 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Удаление дубликатов из списка списков в Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 5 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов