Найти все элементы с топ-5 уникальными значениями на основе 2-го элемента в списке кортежей - PullRequest
3 голосов
/ 09 апреля 2019

Я хочу найти все элементы кортежа с 5 максимальными значениями в списке кортежей на основе 2-го элемента кортежа.Например, у меня есть список кортежей

x1 = [(a, 5), (b, 5), (c, 4), (d, 3), (e, 8), (f, 9), (g, 2), (h, 1)]

Я хочу получить следующий список:

x2 = [(a, 5), (b, 5), (c, 4), (d, 3), (e, 8), (f, 9)]

В качестве верхних 5 уникальных значений для 2-х элементов 9, 8, 5,4, 3 и a, b оба имеют значение 5, они оба должны быть включены в список.

Есть идеи, как это реализовать?Спасибо!

Ответы [ 4 ]

2 голосов
/ 09 апреля 2019

Найдите 5 первых секундных элементов:

i = set(list({x[1] for x in x1})[-5:])

Фильтр списка:

x2 = list(filter(lambda x: x[1] in i, x1))

Или еще лучше:

ss = {x[1] for x in x1}
if len(ss) > 5:
    i = list(ss)[-5]
    x2 = list(filter(lambda x: x[1] >= i, x1))
else:
    x2 = x1

Выход:

[('a', 5), ('b', 5), ('c', 4), ('d', 3), ('e', 8), ('f', 9)]
1 голос
/ 09 апреля 2019
x1 = [('f', 9), ('e', 8), ('a', 5), ('b', 5), ('c', 4), ('d', 3), ('g', 2), ('h', 1)]
x1.sort(key=lambda x: x[1], reverse=True)
max5set = set()
i = 0
for _, num in x1:
    max5set.add(num)
    i += 1
    if (len(max5set) == 6):
        break
print(x1[:i-1])

вывод:

[('f', 9), ('e', 8), ('a', 5), ('b', 5), ('c', 4), ('d', 3)]

если вы хотите получить этот список кортежей в алфавитном порядке, сделайте

print(sorted(x1[:i-1], key=lambda x: x[0]))

вывод будет

[('a', 5), ('b', 5), ('c', 4), ('d', 3), ('e', 8), ('f', 9)]
0 голосов
/ 09 апреля 2019

Используя numpy:

def my_fun(x1, k):
    import numpy as np

    x2 = np.asarray(x1)                         # Convert to numpy array
    val = np.unique(np.sort(x2[:,1]))[-k:]      # Sort index 1 & find top 'k' unique values
    idx = np.isin(x2[:,1], val)                 # Indices of rows to retain

    x2 = x2[idx].tolist()
    x2 = list(map(tuple, x2))                   # Convert back to list of tuples
    return x2
>>> x1 = [('a', 5), ('b', 5), ('c', 4), ('d', 3), ('e', 8), ('f', 9), ('g', 2), ('h', 1)]

>>> my_fun(x1, 5)
[('a', '5'), ('b', '5'), ('c', '4'), ('d', '3'), ('e', '8'), ('f', '9')]

>>> my_fun(x1, 3)
[('a', '5'), ('b', '5'), ('e', '8'), ('f', '9')]
0 голосов
/ 09 апреля 2019

Использование sorted и itertools.groupby:

import itertools

func = lambda x:x[1]
res = []
n_max = 5
group_by = itertools.groupby(sorted(x1, key=func, reverse=True), key=func)
for _ in range(n_max):
    res.extend(list(next(group_by)[1]))

Выход:

[('f', 9), ('e', 8), ('a', 5), ('b', 5), ('c', 4), ('d', 3)]

Если вы хотите, чтобы окончательный результат был отсортирован, введите sorted еще раз:

sorted(res, key=lambda x:x[0])

Выход:

[('a', 5), ('b', 5), ('c', 4), ('d', 3), ('e', 8), ('f', 9)]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...