Какой самый элегантный способ найти индекс дубликатов в списке C # - PullRequest
9 голосов
/ 27 апреля 2010

У меня есть List<string>, который содержит дубликаты, и мне нужно найти индексы каждого.

Какой самый элегантный и эффективный способ, кроме циклического прохождения всех предметов. Я на .NET 4.0, поэтому LINQ это вариант. Я сделал тонны поиска и подключения найти что-нибудь.

Пример данных:

var data = new List<string>{"fname", "lname", "home", "home", "company"}();

Мне нужно получить индексы "дома".

Ответы [ 4 ]

20 голосов
/ 27 апреля 2010

Вы можете создать объект из каждого элемента, содержащего его индекс, затем сгруппировать по значению и отфильтровать группы, содержащие более одного объекта. Теперь у вас есть список группировки с объектами, содержащими текст и их исходный индекс:

var duplicates = data
  .Select((t,i) => new { Index = i, Text = t })
  .GroupBy(g => g.Text)
  .Where(g => g.Count() > 1);
3 голосов
/ 27 апреля 2010
using System;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        var data = new List<string> { "fname", "lname", "home", "home", "company" };
        foreach (var duplicate in FindDuplicates(data))
        {
            Console.WriteLine("Duplicate: {0} at index {1}", duplicate.Item1, duplicate.Item2);
        }
    }

    public static IEnumerable<Tuple<T, int>> FindDuplicates<T>(IEnumerable<T> data)
    {
        var hashSet = new HashSet<T>();
        int index = 0;
        foreach (var item in data)
        {
            if (hashSet.Contains(item))
            {
                yield return Tuple.Create(item, index);
            }
            else
            {
                hashSet.Add(item);
            }
            index++;
        }
    }
}
0 голосов
/ 30 апреля 2015

Мне самому нужно было найти и удалить дубликаты из списка строк. Сначала я искал индексы дублирующих элементов, а затем отфильтровал список функционально, используя LINQ, не изменяя первоначальный список:

public static IEnumerable<string> RemoveDuplicates(IEnumerable<string> items)
{
    var duplicateIndexes =  items.Select((item, index) => new { item, index })
                            .GroupBy(g => g.item)
                            .Where(g => g.Count() > 1)
                            .SelectMany(g => g.Skip(1), (g, item) => item.index);
    return items.Where((item, index) => !duplicateIndexes.Contains(index));
}
0 голосов
/ 27 апреля 2010

Как насчет этого

var data = new List<string>{"fname", "lname", "home", "home", "company"};

            var duplicates = data
                            .Select((x, index) => new { Text = x, index})
                            .Where( x => (  data
                                            .GroupBy(i => i)
                                            .Where(g => g.Count() > 1)
                                            .Select(g => g.Key).ToList()
                                          ).Contains(x.Text));
...