Итак, у меня есть огромный сжатый файл VCF, который содержит геномы 722 клыков, и мне нужно выполнить следующую команду, используя bcftools.
bcftools view -f PASS --thread 8 -r chr9:55252802-55298244 -o 722g.990.SNP.INDEL.dynamin1.vcf.gz -O z 722g.990.SNP.INDEL.chrAll.vcf.bgz
Индексный файл, который сопровождал данные, был «создан перед файлом», поэтому я сгенерировал его заново с использованием tabix:
tabix vcf -p 772g.990.SNP.INDEL.chrAll.vcf.bgz
Это успешно сгенерировало индексный файл (.tbi), которыйнаходится в том же рабочем каталоге, что и набор данных.Однако, когда я запускаю свою команду, я получаю следующее:
Failed to open 722g.990.SNP.INDEL.chrAll.vcf.bgz: could not load index
Индексный файл - это файл .tbi, это важно?было бы лучше индексировать его с помощью bcftools?Я не хочу пробовать это, если это не поможет, потому что индексирование с использованием tabix заняло несколько часов.