Linq. Any VS. Exists - Какая разница? - PullRequest
375 голосов
/ 18 мая 2009

Используя Linq для коллекций, в чем разница между следующими строками кода?

if(!coll.Any(i => i.Value))

и

if(!coll.Exists(i => i.Value))

Обновление 1

Когда я разбираю .Exists, похоже, что кода нет.

Обновление 2

Кто-нибудь знает, почему там нет кода для этого?

Ответы [ 6 ]

381 голосов
/ 19 мая 2009

См. Документацию

List.Exists (Метод объекта - MSDN)

Определяет, содержит ли List (T) элементы, которые соответствуют условиям, заданным указанным предикатом.

Это существует с .NET 2.0, так до LINQ. Предназначен для использования с предикатом делегат , но лямбда-выражения обратно совместимы. Кроме того, это есть только в List (даже в IList)

IEnumerable.Any (метод расширения - MSDN)

Определяет, удовлетворяет ли какой-либо элемент последовательности условию.

Это новое в .NET 3.5 и использует Func (TSource, bool) в качестве аргумента, поэтому он предназначен для использования с лямбда-выражениями и LINQ.

По поведению они идентичны.

187 голосов
/ 18 мая 2009

Разница в том, что Any - это метод расширения для любого IEnumerable<T>, определенного в System.Linq.Enumerable. Может использоваться на любом экземпляре IEnumerable<T>.

Exists не является методом расширения. Я предполагаю, что coll имеет тип List<T>. Если так, то Exists - это метод экземпляра, который очень похож на Any.

Короче говоря , методы по сути одинаковы. Одно более общее, чем другое.

  • Любой также имеет перегрузку, которая не принимает параметров и просто ищет любой элемент в перечисляемом.
  • Существует не имеет такой перегрузки.
47 голосов
/ 30 ноября 2015

TLDR; По производительности Any кажется медленнее (если я настроил это правильно, чтобы оценить оба значения практически одновременно)

        var list1 = Generate(1000000);
        var forceListEval = list1.SingleOrDefault(o => o == "0123456789012");
        if (forceListEval != "sdsdf")
        {
            var s = string.Empty;
            var start2 = DateTime.Now;
            if (!list1.Exists(o => o == "0123456789012"))
            {
                var end2 = DateTime.Now;
                s += " Exists: " + end2.Subtract(start2);
            }

            var start1 = DateTime.Now;
            if (!list1.Any(o => o == "0123456789012"))
            {
                var end1 = DateTime.Now;
                s +=" Any: " +end1.Subtract(start1);
            }

            if (!s.Contains("sdfsd"))
            {

            }

генератор списка тестирования:

private List<string> Generate(int count)
    {
        var list = new List<string>();
        for (int i = 0; i < count; i++)
        {
            list.Add( new string(
            Enumerable.Repeat("ABCDEFGHIJKLMNOPQRSTUVWXYZ", 13)
                .Select(s =>
                {
                    var cryptoResult = new byte[4];
                    new RNGCryptoServiceProvider().GetBytes(cryptoResult);
                    return s[new Random(BitConverter.ToInt32(cryptoResult, 0)).Next(s.Length)];
                })
                .ToArray())); 
        }

        return list;
    }

С 10М записями

"Любой: 00: 00: 00.3770377 Существует: 00: 00: 00.2490249"

С 5М записями

"Любой: 00: 00: 00.0940094 Существует: 00: 00: 00.1420142"

С 1М записями

"Любые: 00: 00: 00.0180018 Существуют: 00: 00: 00.0090009"

С 500k, (я также переключил порядок, в котором они оцениваются, чтобы увидеть, нет ли дополнительных операций, связанных с тем, что запускается первым.)

"Существует: 00: 00: 00.0050005 Любой: 00: 00: 00.0100010"

С записью 100k

"Существует: 00: 00: 00.0010001 Любой: 00: 00: 00.0020002"

Казалось бы, Any медленнее на 2 *.

Редактировать: Для записей 5 и 10M я изменил способ создания списка, и Exists неожиданно стал медленнее, чем Any, что указывает на то, что в моем тестировании что-то не так.

Новый механизм тестирования:

private static IEnumerable<string> Generate(int count)
    {
        var cripto = new RNGCryptoServiceProvider();
        Func<string> getString = () => new string(
            Enumerable.Repeat("ABCDEFGHIJKLMNOPQRSTUVWXYZ", 13)
                .Select(s =>
                {
                    var cryptoResult = new byte[4];
                    cripto.GetBytes(cryptoResult);
                    return s[new Random(BitConverter.ToInt32(cryptoResult, 0)).Next(s.Length)];
                })
                .ToArray());

        var list = new ConcurrentBag<string>();
        var x = Parallel.For(0, count, o => list.Add(getString()));
        return list;
    }

    private static void Test()
    {
        var list = Generate(10000000);
        var list1 = list.ToList();
        var forceListEval = list1.SingleOrDefault(o => o == "0123456789012");
        if (forceListEval != "sdsdf")
        {
            var s = string.Empty;

            var start1 = DateTime.Now;
            if (!list1.Any(o => o == "0123456789012"))
            {
                var end1 = DateTime.Now;
                s += " Any: " + end1.Subtract(start1);
            }

            var start2 = DateTime.Now;
            if (!list1.Exists(o => o == "0123456789012"))
            {
                var end2 = DateTime.Now;
                s += " Exists: " + end2.Subtract(start2);
            }

            if (!s.Contains("sdfsd"))
            {

            }
        }

Edit2: Хорошо, чтобы исключить влияние генерации тестовых данных, я записал все это в файл и теперь прочитал его оттуда.

 private static void Test()
    {
        var list1 = File.ReadAllLines("test.txt").Take(500000).ToList();
        var forceListEval = list1.SingleOrDefault(o => o == "0123456789012");
        if (forceListEval != "sdsdf")
        {
            var s = string.Empty;
            var start1 = DateTime.Now;
            if (!list1.Any(o => o == "0123456789012"))
            {
                var end1 = DateTime.Now;
                s += " Any: " + end1.Subtract(start1);
            }

            var start2 = DateTime.Now;
            if (!list1.Exists(o => o == "0123456789012"))
            {
                var end2 = DateTime.Now;
                s += " Exists: " + end2.Subtract(start2);
            }

            if (!s.Contains("sdfsd"))
            {
            }
        }
    }

10M

"Любой: 00: 00: 00.1640164 Существует: 00: 00: 00.0750075"

5M

"Любые: 00: 00: 00.0810081 Существуют: 00: 00: 00.0360036"

1M

"Любые: 00: 00: 00.0190019 Существуют: 00: 00: 00.0070007"

500k

"Любой: 00: 00: 00.0120012 Существует: 00: 00: 00.0040004"

enter image description here

14 голосов
/ 27 сентября 2016

В качестве продолжения ответа Matas о сравнительном анализе.

TL / DR : Существуют () и Любые () одинаково быстро.

Прежде всего: бенчмаркинг с использованием секундомера не является точным ( см. Ответ series0ne на другую, но похожую тему ), но он гораздо точнее, чем DateTime.

Способ получить действительно точные показания с помощью профилирования производительности. Но один из способов получить представление о том, как производительность двух методов соотносится друг с другом, состоит в том, чтобы выполнить оба метода загружает раз, а затем сравнить самое быстрое время выполнения каждого из них. Таким образом, на самом деле не имеет значения, что JITing и другие шумы дают нам плохие показания (а это делает ), потому что оба исполнения " одинаково вводят в заблуждение " в некотором смысле.

static void Main(string[] args)
    {
        Console.WriteLine("Generating list...");
        List<string> list = GenerateTestList(1000000);
        var s = string.Empty;

        Stopwatch sw;
        Stopwatch sw2;
        List<long> existsTimes = new List<long>();
        List<long> anyTimes = new List<long>();

        Console.WriteLine("Executing...");
        for (int j = 0; j < 1000; j++)
        {
            sw = Stopwatch.StartNew();
            if (!list.Exists(o => o == "0123456789012"))
            {
                sw.Stop();
                existsTimes.Add(sw.ElapsedTicks);
            }
        }

        for (int j = 0; j < 1000; j++)
        {
            sw2 = Stopwatch.StartNew();
            if (!list.Exists(o => o == "0123456789012"))
            {
                sw2.Stop();
                anyTimes.Add(sw2.ElapsedTicks);
            }
        }

        long existsFastest = existsTimes.Min();
        long anyFastest = anyTimes.Min();

        Console.WriteLine(string.Format("Fastest Exists() execution: {0} ticks\nFastest Any() execution: {1} ticks", existsFastest.ToString(), anyFastest.ToString()));
        Console.WriteLine("Benchmark finished. Press any key.");
        Console.ReadKey();
    }

    public static List<string> GenerateTestList(int count)
    {
        var list = new List<string>();
        for (int i = 0; i < count; i++)
        {
            Random r = new Random();
            int it = r.Next(0, 100);
            list.Add(new string('s', it));
        }
        return list;
    }

После выполнения вышеуказанного кода 4 раза (что, в свою очередь, составляет 1 000 Exists() и Any() в списке с 1 000 000 элементов), нетрудно понять, что методы в значительной степени одинаково быстры.

Fastest Exists() execution: 57881 ticks
Fastest Any() execution: 58272 ticks

Fastest Exists() execution: 58133 ticks
Fastest Any() execution: 58063 ticks

Fastest Exists() execution: 58482 ticks
Fastest Any() execution: 58982 ticks

Fastest Exists() execution: 57121 ticks
Fastest Any() execution: 57317 ticks

Там - это небольшая разница, но она слишком мала, чтобы ее нельзя было объяснить фоновым шумом. Я полагаю, что если вместо этого сделать 10 000 или 100 000 Exists() и Any(), то эта небольшая разница исчезнет более или менее.

4 голосов
/ 07 апреля 2017

Когда вы исправите измерения - как упомянуто выше: Любое и Существует, и добавив среднее - мы получим следующий вывод:

Executing search Exists() 1000 times ... 
Average Exists(): 35566,023
Fastest Exists() execution: 32226 

Executing search Any() 1000 times ... 
Average Any(): 58852,435
Fastest Any() execution: 52269 ticks

Benchmark finished. Press any key.
4 голосов
/ 18 мая 2009

Кроме того, это будет работать, только если значение имеет тип bool. Обычно это используется с предикатами. Любой предикат, как правило, используется для определения наличия какого-либо элемента, удовлетворяющего заданному условию. Здесь вы просто делаете карту из вашего элемента i в свойство bool. Он будет искать «я», свойство Value которого имеет значение true. После завершения метод вернет true.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...