У меня есть следующая таблица:
Col1 | Col2 | Col3
AAA | 1 | a
AAA | 1 | a
AAA | 1 | b
AAA | 2 | b
AAA | 2 | b
AAA | 2 | b
AAA | 3 | a
BBB | 1 | b
BBB | 1 | b
Я хочу уменьшить таблицу за два следующих шага:
Найти наиболее часто встречающееся значение вCol3, соответствующее паре значений (Col1, Col2).
Из результата шага 1 сохраните только наиболее часто встречающееся значение, соответствующее значению Col1.
Применение шага 1 к таблице выше: режим (или наиболее часто встречающееся значение), соответствующий (AAA, 1)
, равен a
и т. Д.Мы получаем:
Col1 | Col2 | newCol1
AAA | 1 | a
AAA | 2 | b
AAA | 3 | a
BBB | 1 | b
Применяя шаг 2 к этой таблице, мы видим, что a
- это режим, соответствующий AAA
, а b
- наиболее часто встречающееся значение, соответствующее BBB
- поэтому мыполучить:
Col1 | newCol2
AAA | a
BBB | b