У меня много проблем с вычислением правильных значений Fst для моих SNP.Хотя в моих данных нет популяции, я добавил поп-фактор как фактор, разделив мои данные на 4 разных популяции.Один из реки, один из озера, а два других являются внешними группами (разные виды).
Я использую файл СТРУКТУРА для своих локусов, с отсутствующими значениями -9 ... Я пытался закодировать этовместо NA, как я думал, это вызовет проблемы, но пропущенное должно быть целым числом.
MG_Sample10 3 2 3 2 3 0 2 2 0 0 3 3 0 1 1 2 0 2 0 3 1 0 3 1 3 2 1 3 3 1 0 2 3 0 2 -9 -9 3
MG_Sample13 3 2 3 2 3 0 -9 1 0 0 3 2 2 1 1 1 0 2 0 3 -9 -9 3 0 3 2 1 3 3 3 2 2 2 3 2 -9 -9 3 0 2 2 3 1 1 0 0 3 2 2 1 3 0 1 1
Мои популяции кодируются 1-4 в одном столбце, соответствующем образцам.Я использовал приведенный ниже код.
library(adegenet)
library(hierfstat)
library(reshape)
file <- read.structure("file.str")
population <-read.csv("population.csv", header= F)
file@pop <- as.factor (population$V1)
hierfile <- genind2hierfstat(file)
FST <- pairwise.fst(file, pop=NULL, res.type=c("dist", "matrix"))
Мои значения Fst продолжают оставаться действительно низкими, самое высокое - 0,15 между населением моей реки и озером.Выходные группы имеют минус значения.Я надеялся получить что-то вроде 0,2 для двух групп, которые я сравниваю, и, возможно, 0,6 для групп, поскольку они не должны скрещиваться!