У меня есть набор данных с информацией о пользователе.Для конкретного пользователя у меня часто несколько строк с более или менее полной информацией.Я хочу суммировать все строки, принадлежащие клиенту, на основе First_Name, Last_Name, Street, сохраняя при этом всю информацию о других столбцах, и, если есть два уникальных наблюдения для конкретного столбца, я хочу свернуть их с помощью ",".
Вот как выглядит df
First_Name Last_Name Street Column1 Colum2 Colum_n
Mike Smith X abc ab a
Mike Smith X abc ad b
John Smith Y xyz xy n
John Smith Y xyz xm NA
Мой желаемый результат будет
First_Name Last_Name Street Column1 Colum2 Colum_n
Mike Smith X abc ab,ad a,b
John Smith Y xyz xy,xm n
Я хотел бы использовать dplyr и попробовать что-то с
df %>%
group_by(First_Name,Last_Name, Street) %>%
summarise_all(funs())
Проблема с этой функцией заключается в том, что у меня была возможность использовать только что-то вроде среднего значения или первого встречающегося значения для столбца, и это означало бы потерю значений.То, что я хотел бы, это столбцы со всеми уникальными значениями без NA