Я свел свою проблему к набору данных (df_sum), который состоит только из символов, например
"LPC(20:1) uM" "LPE(16:0) uM" "LPE(16:1) uM" "LPE(18:0) uM" "LPE(18:1) uM" "PA(32:1) uM" "PA(34:1) uM"
"PA(36:1) uM" "PS(34:1) uM" "PS(36:1) uM" "PG(34:1) uM" "PG(36:1) uM" "PE(28:0) uM" "PE(30:1) uM"
"LPC(20:1)" "LPE(16:0)" "LPE(16:1)" "LPE(18:0)" "LPE(18:1)" "PA(32:1)" "PA(34:1)"
"PS(36:1)" "PG(34:1)"
Как видите, некоторые значения совпадают, но с дополнительным тегом "uM" вконец.
Моя цель - найти, какие значения являются уникальными и фактически одинаковыми, без удаления тега uM (что я пробовал, например, df_sum <- sub(" uM", "", df_sum)
)
Любая помощь будет принята с благодарностью