Итак, у меня есть два столбца, которые выглядят так:
V1 V2
ENSP00000222573_N559D ENSG00000105855
ENSP00000222573_N559D ENSG00000105855
ENSP00000267853_E337* ENSG00000108239
ENSP00000299441_R1672P,R1672G ENSG00000127415
ENSP00000334642_K277N. ENSG00000134324
ENSP00000342952_N585R ENSG00000134324
Во-первых, мне нужен первый столбец для извлечения всех букв / знаков после _, поэтому результаты должны выглядеть следующим образом:
V1 V2
ND ENSG00000105855
ND ENSG00000105855
E* ENSG00000108239
RP,RG ENSG00000127415
KN ENSG00000134324
NR ENSG00000134324
Тогда я бы хотел отфильтровать так, чтобы только тогда, когда оба V1 и V2 вместе удваиваются, они отфильтровываются.Таким образом, окончательный результат будет:
V1 V2
ND ENSG00000105855
E* ENSG00000108239
RP,RG ENSG00000127415
KN ENSG00000134324
NR ENSG00000134324