Ваш входной набор данных имеет две нерегулярные строки. Тем не менее, подход в вашем решении правильный, но требуется еще один шаг:
library(dplyr)
df %>% select(V3,V1) %>% group_by(V3) %>% mutate(x = paste(V1,collapse=" ")) %>% select(V3,x)
То, что мы здесь сделали, это просто концентрация строк на V3
. Перед запуском вышеупомянутого кода в этом решении вы должны предварительно обработать и исправить некоторые неправильные строки вручную. Строки (TIM, Dannase и DLH). Для этого вы можете использовать функцию Преобразование текстов в столбец в Excel.
Определены необходимые шаги ниже. Проблематичные c столбцы выделены желтым цветом:
Извините за не английский sh интерфейс моего Excel, но путь не требует пояснений.