Мне нужно свернуть большую таблицу (5M на V19), где я удаляю дубликаты на основе определенного столбца (V1), объединяю значения всех других столбцов, если они уникальны (если нет, то сообщаю результат только один раз).
Я попробовал некоторые решения отсюда, но эти примеры были в основном выполнены для 2 переменных - у меня есть 19. В итоге получается, что вся остальная часть таблицы объединяется в один столбец числового списка.
Ввод:
V1 V2 V3 V4 V5 V6
TR1000 chr1 1000 1200 A +
TR1000 chr1 1000 1200 B +
TR1000 chr1 1000 1200 C +
TR2000 chr2 2000 2500 D +
TR2000 chr2 2000 2500 E +
TR3000 chr3 3000 3500 F +
Мне нужно:
V1 V2 V3 V4 V5 V6
TR1000 chr1 1000 1200 A, B, C +
TR2000 chr2 2000 2500 D, E +
TR3000 chr3 3000 3500 F +