Я пытаюсь заставить мой код работать. Я использую функцию IRanges (пакет: Bioconductor), чтобы получить специфические c фрагменты последовательности из человеческой хромосомы 22. Мне удалось сделать все, и я даже, кажется, получаю правильный ответ. Тем не менее, все еще появляется ошибка, которая также не позволяет мне связать мой файл .Rmd в файл. html. Вот мой оригинальный код:
HindIII <- DNAStringSet("AAGCTT")
pdict0 <- PDict(HindIII)
params_2 <- new("BSParams", X = Hsapiens, FUN = matchPDict, simplify = TRUE, exclude = c("M", "_",
"chrU", "alt", "random"))
count_matches <- bsapply(params_2, pdict = pdict0)
cut_sites <- as.data.frame(count_matches$chr22)
cut_sites <- cut_sites[ -c(1:2, 4:5)]
cut_sites <- rbind(c(0), cut_sites)
cut_sites <- rbind(cut_sites, c(length(Hsapiens$chr22)))
s_seqs <- DNAStringSet()
for (i in 1:nrow(cut_sites)) {
fragments <- as.data.frame(IRanges(start = cut_sites[i,]+1, end = cut_sites[i+1,]))
seqs <- DNAStringSet(getSeq(Hsapiens, "chr22", start = fragments[,1],
end = fragments[,2]))
s_seqs <- c(s_seqs, seqs)
}
length(s_seqs) #8677 sequences
И я получаю то, что хочу:
head(s_seqs)
A DNAStringSet instance of length 6
width seq
[1] 10512059 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN...TCTGTCTTGCCTGAATTTAAGCGTTAACAGGAA
[2] 4272 AGCTTTCCAGGTTGGGGATATTAAGAATAAATGA...AAGGAAAATTCTGTCGTATTTCAACATGTATCA
[3] 838 AGCTTAAGGATATTGTGCTAAGTGAAATAAGCCA...ACCTTCTCTGTGGAATAGAGAGGTGGAAGGGAA
[4] 1570 AGCTTGAAGCAGAGAGAGCAGTGAAGAGTGTGCT...TAGAGATTTGTCACCCAAAGCAAAACAAATTCA
[5] 4509 AGCTTGAACTGAGTTGACATTGGTAGTTATTATG...ATACTGTTATAAACACTCTTTCTATTTATTCAA
[6] 1268 AGCTTGAATTGAGCTAGCTGCTAATAACATTTTT...ATTGGAAATACACTGTGGTTCCTCATATCCTCA
Но я все еще получаю сообщение об ошибке, которое также не позволяет мне вязать мой файл:
Error in .Call2("solve_user_SEW0", start, end, width, PACKAGE = "IRanges") :
In range 1: at least two out of 'start', 'end', and 'width', must
be supplied.
Я был бы очень признателен за советы, как это исправить. Было бы полезно просто связать файл html.