Мне было интересно, сможет ли какой-нибудь ИТ-гуру помочь мне с проблемой группировки, которая у меня возникла с набором данных. У меня есть набор данных, аналогичный приведенному ниже:
| ID | Colour | Start Date | End Date |
|----|--------|------------|------------|
| A | Red | 01/01/2018 | 31/01/2018 |
| A | Red | 01/02/2018 | 28/02/2018 |
| A | Blue | 01/03/2018 | 31/03/2018 |
| A | Blue | 01/04/2018 | 30/04/2018 |
| A | Red | 01/05/2018 | 31/05/2018 |
| A | Blue | 01/06/2018 | 30/06/2018 |
В основном я хочу сгруппировать данные по идентификатору и цвету и показать минимальную дату начала и максимальную дату окончания. Однако сложность заключается в том, что если есть цветовой разрыв, я бы хотел, чтобы это повторило группировку. Таким образом, идеальные результаты для приведенной выше таблицы:
| ID | Colour | Start Date | End Date |
|----|--------|------------|------------|
| A | Red | 01/01/2018 | 28/02/2018 |
| A | Blue | 01/03/2018 | 30/04/2018 |
| A | Red | 01/05/2018 | 31/05/2018 |
| A | Blue | 01/06/2018 | 30/06/2018 |
Может ли кто-нибудь предложить какие-либо предложения. Это также должно быть достаточно эффективным способом, так как данных достаточно много. На самом деле очень трудно с этим справиться, поэтому любая помощь будет чрезвычайно признательна.