Эмм, не будет ли NA
означать, что в некоторых snps отсутствуют значения данных? Чтобы удалить их, вы должны использовать команду --geno
. Цитировать документы :
- geno отфильтровывает все варианты, у которых пропущенные тарифы на вызовы превышают заданное значение (по умолчанию 0,1) для удаления.
Команда --maf
, однако, удаляет мономорфные snps. Установка --maf немного выше 0 может быть разумной, потому что, если аллель обнаружен с очень низкой частотой, это может представлять ошибку генотипирования.
В общем, вы можете захотеть вставить контроль качества следующего типа в вашу команду plink:
--geno 0.03 --hwe 0.00001 --maf 0.00001
(hwe
- это просто регулярное равновесие Харди-Вайнберга).