У меня есть очень большой CSV-файл со следующей структурой:
a1 b1 c1 a2 b2 c2 a3 b3 c3 ..... a999 b999 c999
0 5 4 2 3 2 2 6 7 9 ....................
1 2 1 4 4 6 9 3 5 9 ....................
.
.
Что я хочу сделать, это сгруппировать столбцы в наборы по N, для a, b и c, и проверить, когда индексмаксимального значения (argmax) набора изменений в каждой строке.
Таким образом, в приведенном выше примере для N = 3 a1, b1, c1 - первый набор в строке 0, а argmax - 0, 2-й набор - a2, b2, c2, а argmax - все еще 0, 3-йset - это a3, b3, c3, но теперь argmax равно 2. Я действительно ищу скрипт, который анализирует весь CSV-файл и возвращает [c3, c1].c3, потому что именно там argmax изменяется в строке 0, а c1, потому что argmax не изменяется в строке 1, но c1 является наибольшим значением в этом наборе.
Я делаю это прямо сейчас, используя два цикла for и он медленный и выглядит очень некрасиво, есть ли лучший способ сделать это для pandas pythonic?Я чувствую, что должно быть.