У меня есть файл таксономии, который имеет следующую структуру:
Могу ли я использовать что-то вроде grep (у меня нет опыта здесь) для удаления элементы из столбца таксона?
Например, вместо:
D_0__Bacteria;D_1__Fusobacteria;D_2__Fusobacteriia;D_3__Fusobacteriales;D_4__Fusobacteriaceae;D_5__Fusobacterium
Могу ли я удалить все до и после "Fusobacterium", чтобы он только говорил:
Fusobacterium
Некоторые строки go до уровня вида, поэтому мне нужно будет удалить детали после 5-го уровня идентификации. Например:
Изменить :
D_0__Bacteria;D_1__Proteobacteria;D_2__Gammaproteobacteria;D_3__Pasteurellales;D_4__Pasteurellaceae;D_5__Haemophilus;D_6__Pasteurellaceae bacterium canine oral taxon 272
На :
Haemophilus