У меня есть некоторые временные данные для эксперимента, и я хотел бы сгруппировать их по значению индекса в первом столбце. Значение индекса - это количество элементов, отображаемых в этом столбце, поскольку оно измеряет производительность алгоритма, масштабирующего его по нескольким узлам (значением является количество узлов и время для каждого из них). Таким образом, данные будут выглядеть так:
+---+----------+---------+--+--------+
| 1 | 3596449 | | | |
| 1 | 3526532 | | | |
| 1 | 3525325 | | | |
| 2 | 3595235 | 2432343 | | |
| 3 | 3789900 | 2432343 | | 345675 |
+---+----------+---------+--+--------+
и так далее. Файл, из которого он получен, будет иметь вид:
1,3596449
1,3526532
1,3525325
2,3595235,2432343
3,3789900,2432343,345675
.
.
.
В идеале это будет:
+---+---------+---------+---------+-----+
| 1 | 3596449 | 3526532 | 3525325 | ... |
| 2 | 3595235 | 2432343 | ... | |
| 3 | 3789900 | 2432343 | 345675 | ... |
+---+---------+---------+---------+-----+
Поскольку существуют повторения, они будут сгруппированы по значению индекса и объединены в один строка. Для каждого значения индекса будет переменное количество точек данных.
Я столкнулся с проблемами, поскольку фреймы данных работают только для данных одинаковой длины. Я обнаружил, что списки имеют переменную длину, но я не уверен, как бы я построил этот список из чтения в данных.
Спасибо за любую помощь