Извлечение значений из matchPattern - PullRequest
1 голос
/ 27 октября 2019

Я использую функцию matchPattern из пакета Biostrings, чтобы найти определенные последовательности в геноме. Найдя, я хочу показать и распределение частот промежутков между совпадающими экземплярами.

Пример: выполнение следующего кода

Match1 <- matchPattern(ResEnz, genome$chr1)
Match1

вернет это:

Views on a 248956422-letter DNAString subject
subject: NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN...NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
views:
            start       end width
    [1]     27974     27979     6 [GAATTC]
    [2]     29889     29894     6 [GAATTC]
    [3]     32212     32217     6 [GAATTC]
    [4]     36941     36946     6 [GAATTC]
    [5]     49920     49925     6 [GAATTC]
    ...       ...       ...   ... ...
[67137] 248927762 248927767     6 [GAATTC]
[67138] 248928956 248928961     6 [GAATTC]
[67139] 248929077 248929082     6 [GAATTC]
[67140] 248932486 248932491     6 [GAATTC]
[67141] 248941974 248941979     6 [GAATTC]

Теперь я хочу использовать эти данные для формирования вектора, который будет иметьразличия между конечной точкой одной записи и начальной точкой последующей. (игнорируя самую первую начальную точку и самую последнюю конечную точку)

Т.е. для Match1

1910, 2318, 4724, 12974 .... 9483 

Сгенерированный объект Match1 принадлежит классу XStringViews, функция names возвращает NA, и я в настоящее время озадаченотносительно того, как идти об этом. Пожалуйста, помогите.

1 Ответ

2 голосов
/ 27 октября 2019

После дальнейшего изучения я обнаружил, что функции start(Match1) и end(Match1) будут давать векторы, содержащие значения, представляющие интерес. Я оставлю это здесь на случай, если кто-то столкнется с той же проблемой.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...