У меня есть фрейм данных, и я хочу удалить строки с дублированными строками в двух столбцах (с именами «Вверх» и «Вниз»). Если некоторые строки имеют повторяющиеся строковые значения только в 1 из 2 столбцов, их не следует удалять. Из дублированных строк я хотел бы сохранить ту, в которой столбец с наибольшим значением найден в другом столбце (с именем «Fold»). Помимо этой задачи, 4-й столбец (с именем «Имя») также требует некоторых замен символов следующим образом:
Из этого:
ID Name Fold Up Down
1 mRNA_splicing(5) 3.2 a,b,c,d,e f,g,h,i
2 mRNA_processing(7) 3.1 a,b,c,d,e f,g,h,i
3 adherens_junctions(5) 2.6 k,l,m p,q,r,s,t,u
4 glucose_transport(4) 3.4 d,j,n o,p,v,w,z
5 hexose_transport(2) 3.5 d,j,n o,p,v,w,y,z
Я хотел бы получить это:
ID Name Fold Up Down
1 mRNA splicing 3.2 a,b,c,d,e f,g,h,i
2 adherens junctions 2.6 k,l,m p,q,r,s,t,u
3 glucose transport 3.4 d,j,n o,p,v,w,z
4 hexose transport 3.5 d,j,n o,p,v,w,y,z
Что касается функций, которые выполняют удаление дублированных строк, то ни duplicate
, ни unique
не работают с символами, что здесь делать? Я ценю ваши элегантные решения.