Удаление дубликатов байтов [] из коллекции - PullRequest
2 голосов
/ 25 июля 2010

Вероятно, это будет чрезвычайно простой вопрос. Я просто пытаюсь удалить дубликаты байтов [] из коллекции.

Поскольку поведение по умолчанию заключается в сравнении ссылок, я подумал, что создание IEqualityComparer будет работать, но это не так.

Я пытался использовать HashSet и LINQ Distinct ().

Пример кода:

using System;
using System.Collections.Generic;
using System.Linq;

namespace cstest
{
    class Program
    {
        static void Main(string[] args)
        {
            var l = new List<byte[]>();
            l.Add(new byte[] { 5, 6, 7 });
            l.Add(new byte[] { 5, 6, 7 });
            Console.WriteLine(l.Distinct(new ByteArrayEqualityComparer()).Count());
            Console.ReadKey();
        }
    }

    class ByteArrayEqualityComparer : IEqualityComparer<byte[]>
    {
        public bool Equals(byte[] x, byte[] y)
        {
            return x.SequenceEqual(y);
        }

        public int GetHashCode(byte[] obj)
        {
            return obj.GetHashCode();
        }
    }
}

Выход:

2

1 Ответ

4 голосов
/ 25 июля 2010

GetHashCode будет использоваться Distinct и не будет работать "как есть"; попробуйте что-то вроде:

int result = 13 * obj.Length;
for(int i = 0 ; i < obj.Length ; i++) {
    result = (17 * result) + obj[i];
}
return result;

, который должен обеспечить необходимые условия равенства для хеш-кодов.

Лично , я бы также развернул тест на равенство для производительности:

if(ReferenceEquals(x,y)) return true;
if(x == null || y == null) return false;
if(x.Length != y.Length) return false;
for(int i = 0 ; i < x.Length; i++) {
    if(x[i] != y[i]) return false;
}
return true;
...