Удалить дубликаты из списка <T>в C # - PullRequest
437 голосов
/ 06 сентября 2008

У кого-нибудь есть быстрый способ дедупликации универсального списка в C #?

Ответы [ 26 ]

745 голосов
/ 06 сентября 2008

Если вы используете .Net 3+, вы можете использовать Linq.

List<T> withDupes = LoadSomeData();
List<T> noDupes = withDupes.Distinct().ToList();
210 голосов
/ 06 сентября 2008

Возможно, вам следует рассмотреть возможность использования HashSet .

Из ссылки MSDN:

using System;
using System.Collections.Generic;

class Program
{
    static void Main()
    {
        HashSet<int> evenNumbers = new HashSet<int>();
        HashSet<int> oddNumbers = new HashSet<int>();

        for (int i = 0; i < 5; i++)
        {
            // Populate numbers with just even numbers.
            evenNumbers.Add(i * 2);

            // Populate oddNumbers with just odd numbers.
            oddNumbers.Add((i * 2) + 1);
        }

        Console.Write("evenNumbers contains {0} elements: ", evenNumbers.Count);
        DisplaySet(evenNumbers);

        Console.Write("oddNumbers contains {0} elements: ", oddNumbers.Count);
        DisplaySet(oddNumbers);

        // Create a new HashSet populated with even numbers.
        HashSet<int> numbers = new HashSet<int>(evenNumbers);
        Console.WriteLine("numbers UnionWith oddNumbers...");
        numbers.UnionWith(oddNumbers);

        Console.Write("numbers contains {0} elements: ", numbers.Count);
        DisplaySet(numbers);
    }

    private static void DisplaySet(HashSet<int> set)
    {
        Console.Write("{");
        foreach (int i in set)
        {
            Console.Write(" {0}", i);
        }
        Console.WriteLine(" }");
    }
}

/* This example produces output similar to the following:
 * evenNumbers contains 5 elements: { 0 2 4 6 8 }
 * oddNumbers contains 5 elements: { 1 3 5 7 9 }
 * numbers UnionWith oddNumbers...
 * numbers contains 10 elements: { 0 2 4 6 8 1 3 5 7 9 }
 */
142 голосов
/ 06 сентября 2008

Как насчет: -

var noDupes = list.Distinct().ToList();

В .net 3.5?

86 голосов
/ 24 ноября 2009

Просто инициализируйте HashSet списком того же типа:

var noDupes = new HashSet<T>(withDupes);

Или, если вы хотите, чтобы возвращался список:

var noDupsList = new HashSet<T>(withDupes).ToList();
46 голосов
/ 06 сентября 2008

Сортируйте, затем отметьте два и два рядом друг с другом, так как дубликаты будут объединяться.

Примерно так:

list.Sort();
Int32 index = list.Count - 1;
while (index > 0)
{
    if (list[index] == list[index - 1])
    {
        if (index < list.Count - 1)
            (list[index], list[list.Count - 1]) = (list[list.Count - 1], list[index]);
        list.RemoveAt(list.Count - 1);
        index--;
    }
    else
        index--;
}

Примечания:

  • Сравнение выполняется задом наперед, чтобы избежать необходимости прибегать к списку после каждого удаления
  • В этом примере теперь для подстановки используются кортежи значений C #, замените их соответствующим кодом, если вы не можете его использовать
  • Конечный результат больше не сортируется
30 голосов
/ 15 ноября 2012

Это сработало для меня. просто используйте

List<Type> liIDs = liIDs.Distinct().ToList<Type>();

Замените "Тип" на желаемый тип, например. внутр.

27 голосов
/ 27 июля 2012

Мне нравится использовать эту команду:

List<Store> myStoreList = Service.GetStoreListbyProvince(provinceId)
                                                 .GroupBy(s => s.City)
                                                 .Select(grp => grp.FirstOrDefault())
                                                 .OrderBy(s => s.City)
                                                 .ToList();

В моем списке есть следующие поля: Id, StoreName, City, PostalCode Я хотел показать список городов в выпадающем списке, который имеет повторяющиеся значения. Решение: сгруппируйте по городам, затем выберите первый в списке.

Надеюсь, это поможет :)

22 голосов
/ 07 сентября 2008

Как сказал кроноз в .Net 3.5, вы можете использовать Distinct().

В .Net 2 вы можете имитировать это:

public IEnumerable<T> DedupCollection<T> (IEnumerable<T> input) 
{
    var passedValues = new HashSet<T>();

    // Relatively simple dupe check alg used as example
    foreach(T item in input)
        if(passedValues.Add(item)) // True if item is new
            yield return item;
}

Это может быть использовано для дедупликации любой коллекции и возврата значений в исходном порядке.

Обычно фильтровать коллекцию гораздо быстрее (как и Distinct(), и этот пример), чем удалять из нее элементы.

12 голосов
/ 03 апреля 2010

Метод расширения может быть подходящим способом ... что-то вроде этого:

public static List<T> Deduplicate<T>(this List<T> listToDeduplicate)
{
    return listToDeduplicate.Distinct().ToList();
}

А затем позвоните так, например:

List<int> myFilteredList = unfilteredList.Deduplicate();
10 голосов
/ 06 сентября 2008

В Java (я полагаю, C # более или менее идентичен):

list = new ArrayList<T>(new HashSet<T>(list))

Если вы действительно хотите изменить исходный список:

List<T> noDupes = new ArrayList<T>(new HashSet<T>(list));
list.clear();
list.addAll(noDupes);

Чтобы сохранить порядок, просто замените HashSet на LinkedHashSet.

...