Я использую функцию matchPattern
из пакета Biostrings
, чтобы найти определенные последовательности в геноме. Найдя, я хочу показать и распределение частот промежутков между совпадающими экземплярами.
Пример: выполнение следующего кода
Match1 <- matchPattern(ResEnz, genome$chr1)
Match1
вернет это:
Views on a 248956422-letter DNAString subject
subject: NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN...NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
views:
start end width
[1] 27974 27979 6 [GAATTC]
[2] 29889 29894 6 [GAATTC]
[3] 32212 32217 6 [GAATTC]
[4] 36941 36946 6 [GAATTC]
[5] 49920 49925 6 [GAATTC]
... ... ... ... ...
[67137] 248927762 248927767 6 [GAATTC]
[67138] 248928956 248928961 6 [GAATTC]
[67139] 248929077 248929082 6 [GAATTC]
[67140] 248932486 248932491 6 [GAATTC]
[67141] 248941974 248941979 6 [GAATTC]
Теперь я хочу использовать эти данные для формирования вектора, который будет иметьразличия между конечной точкой одной записи и начальной точкой последующей. (игнорируя самую первую начальную точку и самую последнюю конечную точку)
Т.е. для Match1
1910, 2318, 4724, 12974 .... 9483
Сгенерированный объект Match1 принадлежит классу XStringViews, функция names возвращает NA, и я в настоящее время озадаченотносительно того, как идти об этом. Пожалуйста, помогите.