Linq удаление дубликатов с поворотом - PullRequest
1 голос
/ 09 апреля 2010

Я получил список, содержащий все элементы статуса каждого заказа. Проблема, которая у меня есть, заключается в том, что мне нужно удалить все элементы, у которых комбинация статус -> logdate не самая высокая.

* 1003 например *

        var inputs = new List<StatusItem>();
        //note that the 3th id is simply a modifier that adds that amount of secs
        //to the current datetime, to make testing easier
        inputs.Add(new StatusItem(123, 30, 1));
        inputs.Add(new StatusItem(123, 40, 2));
        inputs.Add(new StatusItem(123, 50, 3));
        inputs.Add(new StatusItem(123, 40, 4));
        inputs.Add(new StatusItem(123, 50, 5));

        inputs.Add(new StatusItem(100, 20, 6));
        inputs.Add(new StatusItem(100, 30, 7));
        inputs.Add(new StatusItem(100, 20, 8));
        inputs.Add(new StatusItem(100, 30, 9));
        inputs.Add(new StatusItem(100, 40, 10));
        inputs.Add(new StatusItem(100, 50, 11));
        inputs.Add(new StatusItem(100, 40, 12));

        var l = from i in inputs
                group i by i.internalId
                    into cg
                    select
                             from s in cg
                             group s by s.statusId
                                 into sg
                                 select sg.OrderByDescending(n => n.date).First()
                    ;

edit: для удобства я добавляю также определение класса.

  public class StatusItem
  {
            public int internalId;
            public int statusId;
            public DateTime date;

            public StatusItem(int internalId, int statusId, int secMod)
            {
                this.internalId = internalId;
                this.statusId = statusId;
                date = DateTime.Now.AddSeconds(secMod);
            }
  } 

Это создает список, который возвращает мне следующее:

заказ 123, статус 30, дата 4/9/2010 18:44:21 PM
заказ 123 статус 40 дата 09.04.2010 18:44:24
заказ 123 статус 50 дата 09.04.2010 18:44:25

заказ 100 статус 20 дата 09.04.2010 18:44:28
заказ 100 статус 30 дата 09.04.2010 18:44:29
заказ 100 статус 40 дата 9.04.2010 18:44:32
заказ 100 статус 50 дата 09.04.2010 18:44:31

Это почти правильно. Однако эту последнюю строку, которая имеет статус 50, также необходимо отфильтровать, поскольку она была отменена статусом 40 в списке истории. Вы можете сказать по тому, что его дата ниже, чем у «последнего» элемента статуса со статусом 40.

Я надеялся, что кто-нибудь подскажет мне, потому что я застрял.

Редактировать: Окончательное решение:

  var k = from sg in
                    from i in inputs
                     group i by i.internalId
                         into cg
                         select
                                  from s in cg
                                  group s by s.statusId
                                      into sg
                                      select sg.OrderByDescending(n => n.date).First()
                from s in sg
                where s.date >= sg.Where(n => n.statusId <= s.statusId).Max(n => n.date)
                group s by s.internalId
                    into si
                    from x in si
                    select x;

Ответы [ 2 ]

1 голос
/ 09 апреля 2010

Похоже, что в данный момент у вас нет ничего, что бы выполняло фильтрацию, необходимую для даты, поэтому вам нужно что-то с этим сделать.

От руки, что-то вроде этого будет выполнять дополнительную фильтрацию:

        var k = from sg in l
                from s in sg
                where s.date >= sg.Where(n => n.statusId <= s.statusId).Max(n => n.date)
                group s by s.internalId;

Не проверял, так что группировка может быть не тем, что вы хотите, и сравнения могут быть отменены, но что-то подобное должно отфильтроваться. >= и <= вместо > или < должны означать, что статус всегда будет сравниваться с самим собой и не должен иметь дело с пустым набором в совокупных проблемах.

0 голосов
/ 09 апреля 2010

Это не совсем та же форма, что и у вас, но она дает правильный результат.Я создал класс элементов состояния со свойствами i, j и k.Не уверен, какие имена ты использовал для них.

var keys = inputs.Select(
    input =>
        new { i = input.i, j = input.j })
.Distinct();

var maxes = keys.Select(
    ints =>
        inputs.First(
            input =>
                input.i == ints.i
             && input.j == ints.j
             && input.k == inputs.Where(
                               i =>
                                   i.i == ints.i
                                && i.j == ints.j
                            ).Select(i => i.k).Max()));
...