У меня есть 2 файла со списками генов (и оба файла с другими столбцами, которые содержат различную информацию в списках генов). Я ищу, чтобы определить гены, которые появляются в обоих файлах, и взять информацию о соответствующих генах из обоих файлов, чтобы поместить вновый файл.
Например, данные выглядят так:
File 1
Gene P value
ACT 0.1
BRCA 0.3
AGT 0.004
UMOD 0.05
File 2
Gene Tissue
MTHFR Heart
UMOD.1 Kidney
TP53 Lung
ACT Lung
Я пытаюсь получить вывод, подобный этому:
Gene P value Tissue
UMOD 0.05 Kidney
ACT 0.1 Lung
У меня есть одна проблемав том, что в одном файле есть совпадающие гены, но с дополнительными номерами (например, UMOD против UMOD.1), поэтому, даже если они совпадают, ген не совпадает с именем гена.соответствующие гены, которые я пробовал:
cat file1.txt|grep -f file2.txt > temp.txt
но временный файл пуст, я не уверен, почему это не сработало или что нужно сделать, чтобы получить мой вывод, любая помощь будет оценена.
Я также пытался написать что-то подобное (хотя я знаю, что это все неправильно, я пока не могу найти синтаксис для выбора столбца из другого файла, я нахожусь в процессе изучения awk):
awk 'BEGIN{FS=OFS="\t"} FNR==1{print;next} {if($1==file2.txt $1) print printf $i""FS; print ""}' file1txt > temp.txt