Как узнать различные типы аллелей для каждого SNP в файле .ped - PullRequest
0 голосов
/ 14 марта 2019

У меня есть файл .ped, в котором в каждом столбце есть разные аллели для каждого SNP.

Flori JG05001 0 0 0 -9 TCAATCCTTTCTGGAAGGCCC CGGGGA

Flori JG05002 0 0 0 -9 CCAACCTTTTCTGGGATCGGGGA

Flori JG05002 0 0 0 -9 CCAACCTCTTCTGGGAGATCA CGGGGA

Flori JG05002 0 0 0 -9 CCAACCTCTTCTGGGAGATCA CGGGGT

для каждого столбца для каждого я хочу знатьВозможны аллели, т. е. для столбца 7 у меня будут только варианты T и C.

Спасибо

1 Ответ

1 голос
/ 14 марта 2019

Предполагая, что файл загружен в data.frame с именем df, вы можете просто sapply unique:

sapply(df, unique)

Это даст вам список, где каждый элемент является векторомвсе аллели, которые появились в этом столбце.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...