Я настраиваю процедуру автоматического анализа данных и, более или менее в конце процедуры, я хотел бы автоматически извлечь имя файла, который был проанализирован. У меня есть фрейм данных со столбцом, содержащим имена, со следующим стилем:
- Исходный / Cell_Line_2_ KB_1813_B _Baseline
- Доза 0001 / Cell_Line_3_ KB1720_1 _0001
- Доза 0010 / Cell_Line_1_ KB1810 мат _0010
Я бы хотел выделить только символы, выделенные жирным шрифтом: «KB_1813_B», «KB1720_1» и «KB1810 mat» в отдельном столбце.
Я использовал gsub со следующей командой:
df$column.with.names <- gsub(".*KB|_.*", "KB", df$column.with.new.names)
Я мог бы легко удалить первую часть проблемы, но я застрял, пытаясь удалить вторую часть. Есть ли какая-то команда в gsub для удаления всего, начиная с конца имени, до тех пор, пока вы не встретите специальный символ (в моем случае "_")?
Спасибо:)