Я пытаюсь объединить 3000 бактериальных bcf-файлов с помощью bcftools.Файлы vcf были сгенерированы с использованием GATK, преобразованы в bcf и проиндексированы с помощью bcftools.Bcftools приступает к анализу 20% данных, но продолжает преждевременное завершение и создает объединенные файлы bcf только для части вариантов (до 500 КБ из 2М бактериального генома).Код, который я использую, выглядит следующим образом:
bcftools1.7/bcftools merge -l VarList.txt -0 --missing-to-ref --threads 1 -O b > CombinedVCF
Ошибка вывода:
/bin/sh: line 1: 17041 Segmentation fault (core dumped) bcftools/bcftools merge -l VarList.txt -0 --missing-to-ref --threads 1 -O b > CombinedVCF
Ранее я без проблем пробовал эту же команду для 400 выборок.
Поиск в Интернете: «Сегфоут происходит, когда ссылка на переменную выходит за пределы сегмента, в котором находится эта переменная, или при попытке записи в местоположение, которое находится в сегменте только для чтения».Команда выполняется в кластере с 80 ГБ доступной оперативной памяти для конкретной работы.Я не уверен, связана ли эта ошибка с проблемой самого программного обеспечения bcftools или с ограничением системы, в которой выполняется команда?
Вот примеры файлов bcf для репликации ошибки (https://figshare.com/articles/BCF_file_segfault/7412864). Ошибка появляется только для больших размеров выборки, поэтому я не могу уменьшить размер дальше.