Я пытаюсь найти наиболее эффективный способ отсеивания любых дубликатов в большой хэш-таблице, состоящей из почти 5 тыс. Объектов.
Я выполняю все это в Powershell.Итак, у меня есть эта большая хеш-таблица, которая состоит (по сути) из имен пользователей и подписок
1. User_id | Sub_name
2. User_id | Sub_name
etc...
В большинстве случаев для каждой User_id
существует 5+ строк, поскольку каждая новая строка представляет имя подпискина которого подписан пользователь.
Что мне нужно сделать, это: Определить дубликаты подписок для каждого пользователя.Например,
1. mm1234 | sub_1
2. mm1234 | sub_4
3. mm1234 | sub_1
4. mm9999 | sub_1
5. mm9999 | sub_2
6. mm8888 | sub_1
7. mm8888 | sub_1
Итак, в приведенном выше примере мне нужно удалить строки 3
& 7
.Теперь, в настоящее время нет фактической группировки с точки зрения того, как пользователи группируются в хэше, они просто добавляются. Мне интересно, возможно ли сделать это из окончательного хэша продукта, как показано выше.Мысли?