Python: как сгруппировать подобные списки внутри списков с допуском и взять среднее? - PullRequest
0 голосов
/ 13 апреля 2020

вход -> a = [[297, 151, 320], [293, 151, 305], [296, 151, 320], [295, 162, 306], [297, 160, 309], [300, 158, 321]

У меня есть список внутри списка. Мне нужно сгруппировать по третьему элементу в списке a [i] [2] с допуском + или - 5

output_1 -> a = [[[297, 151, 320 ], [293, 151, 318], [296, 151, 321]], [[295, 162, 306], [297, 160, 309], [300, 158, 305]]

Позже мне нужно взять среднее значение для каждой подгруппы, например, [297, 151, 320], [293, 151, 318], [296, 151, 321] = [(297 + 293 + 296) / 3, (151 + 151 + 151) / 3, (320 + 318 + 321) / 3] аналогично для следующей группы

конечный результат

final_output- -> a = [[[295,151,320]], [[297,160,307]]] *

Кто-нибудь может помочь с этим?

Ответы [ 2 ]

0 голосов
/ 13 апреля 2020

Извините, я не понимаю, чего вы хотите. Потому что значение ur для каждого списка не соответствует. Но вы имели в виду, как этот?

a = [[297, 151, 320], [293, 151, 305], [296, 151, 320], [295, 162, 306], [297, 160, 309], [300, 158, 321]]
b = []
i = -1
for x in range(len(a)):
    if (x%3) == 0:
        b.append([])
        i += 1
    ave = int(sum(a[x])/len(a[x]))
    b[i].append(ave)
print(b)

вывод: [[256, 249, 255], [254, 255, 259]]

0 голосов
/ 13 апреля 2020

Один из способов - создать функцию генератора для группировки допусков. Эта функция предполагает, что список отсортирован, поэтому вам нужно передать отсортированный список или изменить его, чтобы выполнить сортировку в функции. Я уверен, что кто-то найдет способ сделать это с itertools.groupby.

def groupby_tolerance(lst, tolerance):
    result = [lst[0]]

    for prev, curr in zip(lst, lst[1:]):
        if curr[2] - prev[2] > tolerance:
            yield result
            result = []
        result.append(curr)

    yield result

Затем вызывается эта функция в вашем отсортированном списке (по 3-му пункту):

from operator import itemgetter

a = [[297, 151, 320], [293, 151, 305], [296, 151, 320], [295, 162, 306], [297, 160, 309], [300, 158, 321]]

grouped = groupby_tolerance(sorted(a, key=itemgetter(2)), 5)

, что дает группировку:

[[[293, 151, 305], [295, 162, 306], [297, 160, 309]], [[297, 151, 320], [296, 151, 320], [300, 158, 321]]]

Тогда вы можете застегните соответствующие элементы и вычислите среднее значение:

from statistics import mean

averages = [[mean(x) for x in zip(*group)] for group in grouped]

print(averages)

Средние значения:

[[295, 157.66666666666666, 306.6666666666667], [297.6666666666667, 153.33333333333334, 320.3333333333333]]
...