У меня есть такой фрейм данных:
> dns1
variant_id gene_id pval_nominal
21821 chr1_165656237_T_C_b38 ENSG00000143149 1.24119e-05
21822 chr1_165659346_C_CA_b38 ENSG00000143149 1.24119e-05
21823 chr1_165659350_A_G_b38 ENSG00000143149 1.24119e-05
21824 chr1_165659415_A_G_b38 ENSG00000143149 1.24119e-05
21825 chr1_165660430_T_C_b38 ENSG00000143149 1.24119e-05
21826 chr1_165661135_T_G_b38 ENSG00000143149 1.24119e-05
21827 chr1_165661238_C_T_b38 ENSG00000143149 1.24119e-05
...
Я хотел бы удалить все символы из второго столбца (variable_id) и извлечь только второе число, чтобы оно выглядело так:
165656237
165659346
165659350
165659415
165660430
165661135
165661238
...
Я пробовал это:
dns1$variant_id <- gsub('[^0-9.]','',dns1$variant_id)
но с помощью приведенной выше команды я получаю следующее:
> dns1
variant_id gene_id pval_nominal
21821 116565623738 ENSG00000143149 1.24119e-05
21822 116565934638 ENSG00000143149 1.24119e-05
21823 116565935038 ENSG00000143149 1.24119e-05
21824 116565941538 ENSG00000143149 1.24119e-05
...
так что это соответствует всем числам в столбце option_id, и мне нужно было бы получить 16565623738 вместо 116565623738. Итак, вопрос в том, как сопоставить во втором столбце только второе число?