Получить спецификацию строки c для значения столбца из нескольких файлов - PullRequest
0 голосов
/ 22 апреля 2020

У меня есть файл, который содержит частичное имя файла и информацию о позиции, которую нужно искать в имени файла (sample_position.csv).

Sample  Position
118921  41790211
126130  157414064
126130  59506517
126130  26910423
126130  139907721

Каждый образец соответствует файлу .txt, который начинается с номера образца и имеет несколько столбцов, где один из них является столбцом позиции, как в sample_position.csv. Таким образом, у меня есть более 500 файлов, у некоторых есть одна позиция для поиска, у некоторых есть больше. Позиция 2 столбца в каждом текстовом файле. Я ищу извлечение строк из каждого файла TXT, где имя файла TXT соответствует номеру образца и ищет соответствующую позицию в этом файле.

Пример файла .txt (118921):

CHROM   START   REF     ALT     GENE_NAME       TRANS_TYPE      GENE_STRAND     
chr1    13418   G       A       DDX11L1 OTH     +       NCT     n.415-35G>A     
chr1    13418   G       A       DDX11L1 OTH     +       EXONIC-NC       n.666G>A
chr1    13418   G       A       DDX11L1 OTH     +       EXONIC-NC       n.659G>A
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...