Обнаружение последовательности не менее 3 последовательных чисел из заданного списка - PullRequest
22 голосов
/ 02 октября 2010

У меня есть список номеров, например 21,4,7,9,12,22,17,8,2,20,23

Я хочу иметь возможность выбирать последовательности последовательных чисел (минимум 3 элемента в длину), поэтому из приведенного выше примера это будет 7,8,9 и 20,21,22,23.

Я поиграл с несколькими уродливыми растягивающимися функциями, но мне интересно, есть ли изящный LINQ-иш способ сделать это.

Есть предложения?

UPDATE:

Большое спасибо за все ответы, очень ценится. Сейчас я играю со всеми, чтобы понять, какие из них лучше всего интегрируются в наш проект.

Ответы [ 12 ]

27 голосов
/ 02 октября 2010

Меня поражает, что первое, что вы должны сделать, это заказать список.Тогда нужно просто пройтись по ней, запомнить длину текущей последовательности и определить, когда она закончилась.Честно говоря, я подозреваю , что простой цикл foreach будет самым простым способом сделать это - я не могу сразу думать о каких-либо удивительно изящных LINQ-подобных способах сделать это.Вы, конечно, можете сделать это в блоке итератора, если вы действительно этого хотите, но имейте в виду, что упорядочение списка для начала означает, что вы все равно получите разумную «предварительную» стоимость.Таким образом, мое решение выглядело бы примерно так:

var ordered = list.OrderBy(x => x);
int count = 0;
int firstItem = 0; // Irrelevant to start with
foreach (int x in ordered)
{
    // First value in the ordered list: start of a sequence
    if (count == 0)
    {
        firstItem = x;
        count = 1;
    }
    // Skip duplicate values
    else if (x == firstItem + count - 1)
    {
        // No need to do anything
    }
    // New value contributes to sequence
    else if (x == firstItem + count)
    {
        count++;
    }
    // End of one sequence, start of another
    else
    {
        if (count >= 3)
        {
            Console.WriteLine("Found sequence of length {0} starting at {1}",
                              count, firstItem);
        }
        count = 1;
        firstItem = x;
    }
}
if (count >= 3)
{
    Console.WriteLine("Found sequence of length {0} starting at {1}",
                      count, firstItem);
}

РЕДАКТИРОВАТЬ: Хорошо, я только что подумал о несколько более LINQ-иш способ ведения дел.У меня нет времени, чтобы полностью реализовать это сейчас, но:

  • Заказать последовательность
  • Использовать что-то вроде SelectWithPrevious (возможно, лучше назвать SelectConsecutive) для получения последовательных пар элементов
  • Используйте перегрузку Select, которая включает в себя индекс для получения кортежей (index, current, previous)
  • Отфильтруйте любые элементы, где (current = previous+ 1) получить где-нибудь, что считается началом последовательности (индекс особого случая = 0)
  • Используйте SelectWithPrevious в результате, чтобы получить длину последовательности между двумя начальными точками (вычтите один индекс из предыдущей)
  • Отфильтруйте любую последовательность длиной менее 3

I подозреваемый вам нужноконкатить int.MinValue в упорядоченной последовательности, чтобы гарантировать правильное использование конечного элемента.

РЕДАКТИРОВАТЬ: Хорошо, я реализовал это.Речь идет о самом ЛИНКОМ способе, которым я могу придумать, чтобы сделать это ... Я использовал нулевые значения в качестве «дозорных» значений для принудительного начала и окончания последовательности - см. Комментарии для более подробной информации.

В целом, я бы не рекомендовалэто решение.Трудно разобраться, и хотя я достаточно уверен, что это правильно, мне потребовалось некоторое время, чтобы подумать о возможных ошибках и т. Д. Это интересное путешествие в то, что вы можете делать сLINQ ... а также то, что вы, вероятно, не должны.

О, и обратите внимание, что я выдвинул часть "минимальная длина 3" до вызывающей стороны - когда у вас есть последовательность кортежей, как этоЧистее отфильтровывать отдельно, ИМО.

using System;
using System.Collections.Generic;
using System.Linq;

static class Extensions
{
    public static IEnumerable<TResult> SelectConsecutive<TSource, TResult>
        (this IEnumerable<TSource> source,
         Func<TSource, TSource, TResult> selector)
    {
        using (IEnumerator<TSource> iterator = source.GetEnumerator())
        {
           if (!iterator.MoveNext())
           {
               yield break;
           }
           TSource prev = iterator.Current;
           while (iterator.MoveNext())
           {
               TSource current = iterator.Current;
               yield return selector(prev, current);
               prev = current;
           }
        }
    }
}

class Test
{
    static void Main()
    {
        var list = new List<int> {  21,4,7,9,12,22,17,8,2,20,23 };

        foreach (var sequence in FindSequences(list).Where(x => x.Item1 >= 3))
        {
            Console.WriteLine("Found sequence of length {0} starting at {1}",
                              sequence.Item1, sequence.Item2);
        }
    }

    private static readonly int?[] End = { null };

    // Each tuple in the returned sequence is (length, first element)
    public static IEnumerable<Tuple<int, int>> FindSequences
         (IEnumerable<int> input)
    {
        // Use null values at the start and end of the ordered sequence
        // so that the first pair always starts a new sequence starting
        // with the lowest actual element, and the final pair always
        // starts a new one starting with null. That "sequence at the end"
        // is used to compute the length of the *real* final element.
        return End.Concat(input.OrderBy(x => x)
                               .Select(x => (int?) x))
                  .Concat(End)
                  // Work out consecutive pairs of items
                  .SelectConsecutive((x, y) => Tuple.Create(x, y))
                  // Remove duplicates
                  .Where(z => z.Item1 != z.Item2)
                  // Keep the index so we can tell sequence length
                  .Select((z, index) => new { z, index })
                  // Find sequence starting points
                  .Where(both => both.z.Item2 != both.z.Item1 + 1)
                  .SelectConsecutive((start1, start2) => 
                       Tuple.Create(start2.index - start1.index, 
                                    start1.z.Item2.Value));
    }
}
12 голосов
/ 02 октября 2010

Решения Джона Скита / Тимви - это путь.

Ради интереса, вот запрос LINQ, который выполняет свою работу ( очень неэффективно):

var sequences = input.Distinct()
                     .GroupBy(num => Enumerable.Range(num, int.MaxValue - num + 1)
                                               .TakeWhile(input.Contains)
                                               .Last())  //use the last member of the consecutive sequence as the key
                     .Where(seq => seq.Count() >= 3)
                     .Select(seq => seq.OrderBy(num => num)); // not necessary unless ordering is desirable inside each sequence.

Производительность запроса может быть немного улучшена путем загрузки ввода в HashSet (для улучшения Contains), но это все равно не приведет к решению, которое близко к эффективному.

Единственная ошибка, которую яЯ знаю, есть ли вероятность арифметического переполнения, если последовательность содержит отрицательные числа большой величины (мы не можем представить параметр count для Range).Это было бы легко исправить с помощью собственного static IEnumerable<int> To(this int start, int end) extension-метода.Если кто-нибудь может придумать какой-либо другой простой метод уклонения от переполнения, пожалуйста, дайте мне знать.

РЕДАКТИРОВАТЬ: Вот несколько более подробный (но одинаково неэффективный) вариант без проблемы переполнения.

var sequences = input.GroupBy(num => input.Where(candidate => candidate >= num)
                                          .OrderBy(candidate => candidate)
                                          .TakeWhile((candidate, index) => candidate == num + index)
                                          .Last())
                     .Where(seq => seq.Count() >= 3)
                     .Select(seq => seq.OrderBy(num => num));
4 голосов
/ 02 октября 2010

Я думаю, что мое решение более элегантно и просто, и поэтому его легче проверить как правильное:

/// <summary>Returns a collection containing all consecutive sequences of
/// integers in the input collection.</summary>
/// <param name="input">The collection of integers in which to find
/// consecutive sequences.</param>
/// <param name="minLength">Minimum length that a sequence should have
/// to be returned.</param>
static IEnumerable<IEnumerable<int>> ConsecutiveSequences(
    IEnumerable<int> input, int minLength = 1)
{
    var results = new List<List<int>>();
    foreach (var i in input.OrderBy(x => x))
    {
        var existing = results.FirstOrDefault(lst => lst.Last() + 1 == i);
        if (existing == null)
            results.Add(new List<int> { i });
        else
            existing.Add(i);
    }
    return minLength <= 1 ? results :
        results.Where(lst => lst.Count >= minLength);
}

Преимущества перед другими решениями:

  • Он может найти последовательности, которые перекрываются.
  • Это правильно многократно и документировано.
  • Я не нашел никаких ошибок; -)
2 голосов
/ 02 октября 2010

Вот как решить проблему «LINQish»:

int[] arr = new int[]{ 21, 4, 7, 9, 12, 22, 17, 8, 2, 20, 23 };
IOrderedEnumerable<int> sorted = arr.OrderBy(x => x);
int cnt = sorted.Count();
int[] sortedArr = sorted.ToArray();
IEnumerable<int> selected = sortedArr.Where((x, idx) =>
    idx <= cnt - 3 && sortedArr[idx + 1] == x + 1 && sortedArr[idx + 2] == x + 2);
IEnumerable<int> result = selected.SelectMany(x => new int[] { x, x + 1, x + 2 }).Distinct();

Console.WriteLine(string.Join(",", result.Select(x=>x.ToString()).ToArray()));

Из-за копирования и реконструкции массива это решение, разумеется, не так эффективно, как традиционное решение с циклами.

1 голос
/ 03 октября 2010

Вот мой выстрел в это:

public static class SequenceDetector
{
    public static IEnumerable<IEnumerable<T>> DetectSequenceWhere<T>(this IEnumerable<T> sequence, Func<T, T, bool> inSequenceSelector)
    {
        List<T> subsequence = null;
        // We can only have a sequence with 2 or more items
        T last = sequence.FirstOrDefault();
        foreach (var item in sequence.Skip(1))
        {
            if (inSequenceSelector(last, item))
            {
                // These form part of a sequence
                if (subsequence == null)
                {
                    subsequence = new List<T>();
                    subsequence.Add(last);
                }
                subsequence.Add(item);
            }
            else if (subsequence != null)
            {
                // We have a previous seq to return
                yield return subsequence;
                subsequence = null;
            }
            last = item;
        }
        if (subsequence != null)
        {
            // Return any trailing seq
            yield return subsequence;
        }
    }
}

public class test
{
    public static void run()
    {
        var list = new List<int> { 21, 4, 7, 9, 12, 22, 17, 8, 2, 20, 23 };
        foreach (var subsequence in list
            .OrderBy(i => i)
            .Distinct()
            .DetectSequenceWhere((first, second) => first + 1 == second)
            .Where(seq => seq.Count() >= 3))
        {
            Console.WriteLine("Found subsequence {0}", 
                string.Join(", ", subsequence.Select(i => i.ToString()).ToArray()));
        }
    }
}

Возвращает конкретные элементы, которые образуют подпоследовательности, и разрешает любой тип элемента и любое определение критериев, если его можно определить путем сравнения смежных элементов.

1 голос
/ 02 октября 2010

Как насчет сортировки массива, затем создайте другой массив, который будет разностью между каждым элементом предыдущего


sortedArray = 8, 9, 10, 21, 22, 23, 24, 27, 30, 31, 32
diffArray   =    1,  1, 11,  1,  1,  1,  3,  3,  1,  1
Теперь итерируйте массив разностей;если разность равна 1, увеличьте количество переменных sequenceLength на 1. Если разность> 1, проверьте sequenceLength, если оно> = 2, тогда у вас есть последовательность, по крайней мере, из 3 последовательных элементов.Затем сбросьте sequenceLenght в 0 и продолжите ваш цикл в массиве разностей.
1 голос
/ 02 октября 2010

Не 100% Linq, но вот общий вариант:

static IEnumerable<IEnumerable<TItem>> GetSequences<TItem>(
        int minSequenceLength, 
        Func<TItem, TItem, bool> areSequential, 
        IEnumerable<TItem> items)
    where TItem : IComparable<TItem>
{
    items = items
        .OrderBy(n => n)
        .Distinct().ToArray();

    var lastSelected = default(TItem);

    var sequences =
        from startItem in items
        where startItem.Equals(items.First())
            || startItem.CompareTo(lastSelected) > 0
        let sequence =
            from item in items
            where item.Equals(startItem) || areSequential(lastSelected, item)
            select (lastSelected = item)
        where sequence.Count() >= minSequenceLength
        select sequence;

    return sequences;
}

static void UsageInt()
{
    var sequences = GetSequences(
            3,
            (a, b) => a + 1 == b,
            new[] { 21, 4, 7, 9, 12, 22, 17, 8, 2, 20, 23 });

    foreach (var sequence in sequences)
        Console.WriteLine(string.Join(", ", sequence.ToArray()));
}

static void UsageChar()
{
    var list = new List<char>(
        "abcdefghijklmnopqrstuvwxyz".ToCharArray());

    var sequences = GetSequences(
            3,
            (a, b) => (list.IndexOf(a) + 1 == list.IndexOf(b)),
            "PleaseBeGentleWithMe".ToLower().ToCharArray());

    foreach (var sequence in sequences)
        Console.WriteLine(string.Join(", ", sequence.ToArray()));
}
0 голосов
/ 03 октября 2010

Вот решение с использованием словаря вместо сортировки ... Он добавляет элементы в словарь, а затем для каждого значения увеличивается выше и ниже, чтобы найти самую длинную последовательность.
Это не строго LINQ, хотя идействительно использует некоторые функции LINQ, и я думаю, что это более читабельно, чем чистое решение LINQ ..

static void Main(string[] args)
    {
        var items = new[] { -1, 0, 1, 21, -2, 4, 7, 9, 12, 22, 17, 8, 2, 20, 23 };
        IEnumerable<IEnumerable<int>> sequences = FindSequences(items, 3);

        foreach (var sequence in sequences)
        {   //print results to consol
            Console.Out.WriteLine(sequence.Select(num => num.ToString()).Aggregate((a, b) => a + "," + b));
        }
        Console.ReadLine();
    }

    private static IEnumerable<IEnumerable<int>> FindSequences(IEnumerable<int> items, int minSequenceLength)
    {
        //Convert item list to dictionary
        var itemDict = new Dictionary<int, int>();
        foreach (int val in items)
        {
            itemDict[val] = val;
        }
        var allSequences = new List<List<int>>();
        //for each val in items, find longest sequence including that value
        foreach (var item in items)
        {
            var sequence = FindLongestSequenceIncludingValue(itemDict, item);
            allSequences.Add(sequence);
            //remove items from dict to prevent duplicate sequences
            sequence.ForEach(i => itemDict.Remove(i));
        }
        //return only sequences longer than 3
        return allSequences.Where(sequence => sequence.Count >= minSequenceLength).ToList();
    }

    //Find sequence around start param value
    private static List<int> FindLongestSequenceIncludingValue(Dictionary<int, int> itemDict, int value)
    {
        var result = new List<int>();
        //check if num exists in dictionary
        if (!itemDict.ContainsKey(value))
            return result;

        //initialize sequence list
        result.Add(value);

        //find values greater than starting value
        //and add to end of sequence
        var indexUp = value + 1;
        while (itemDict.ContainsKey(indexUp))
        {
            result.Add(itemDict[indexUp]);
            indexUp++;
        }

        //find values lower than starting value 
        //and add to start of sequence
        var indexDown = value - 1;
        while (itemDict.ContainsKey(indexDown))
        {
            result.Insert(0, itemDict[indexDown]);
            indexDown--;
        }
        return result;
    }
0 голосов
/ 03 октября 2010

Вот мой LINQ-й по проблеме:

static IEnumerable<IEnumerable<int>>
    ConsecutiveSequences(this IEnumerable<int> input, int minLength = 3)
{
    int order = 0;
    var inorder = new SortedSet<int>(input);
    return from item in new[] { new { order = 0, val = inorder.First() } }
               .Concat(
                 inorder.Zip(inorder.Skip(1), (x, val) =>
                         new { order = x + 1 == val ? order : ++order, val }))
           group item.val by item.order into list
           where list.Count() >= minLength
           select list;
}
  • не использует явных циклов, но все равно должно быть O (n lg n)
  • использует SortedSet вместо .OrderBy().Distinct()
  • объединяет последовательный элемент с list.Zip(list.Skip(1))
0 голосов
/ 03 октября 2010

Я думал о том же, что и Джон : чтобы представить диапазон последовательных целых чисел, все, что вам действительно нужно, это два ничтожных целых числа!Итак, я бы начал с этого:

struct Range : IEnumerable<int>
{
    readonly int _start;
    readonly int _count;

    public Range(int start, int count)
    {
        _start = start;
        _count = count;
    }

    public int Start
    {
        get { return _start; }
    }

    public int Count
    {
        get { return _count; }
    }

    public int End
    {
        get { return _start + _count - 1; }
    }

    public IEnumerator<int> GetEnumerator()
    {
        for (int i = 0; i < _count; ++i)
        {
            yield return _start + i;
        }
    }

    // Heck, why not?
    public static Range operator +(Range x, int y)
    {
        return new Range(x.Start, x.Count + y);
    }

    // skipping the explicit IEnumerable.GetEnumerator implementation
}

Оттуда вы можете написать статический метод, который будет возвращать набор этих Range значений, соответствующих последовательным номерам вашей последовательности.

Демо:

int[] numbers = new[] { 21, 4, 7, 9, 12, 22, 17, 8, 2, 20, 23 };

foreach (Range r in FindConsecutiveRanges(numbers, 3))
{
    // Using .NET 3.5 here, don't have the much nicer string.Join overloads.
    Console.WriteLine(string.Join(", ", r.Select(x => x.ToString()).ToArray()));
}

Выход:

7, 8, 9
20, 21, 22, 23
...