Измерения MRD у пациентов с лейкемией c с использованием данных NGS в г - PullRequest
0 голосов
/ 05 марта 2020

Мне было интересно, может ли кто-нибудь помочь мне со сценарием и поддержкой для вышеупомянутой цели. Для этого у меня есть несколько файлов BAM, для которых я хочу определить количество нуклеотидов на интересующую область. Последний может быть несколько сайтов мутации горячей точки. Я хотел бы получить общий обзор всех файлов BAM. Далее я хочу использовать эти подсчеты, чтобы определить для любого нового файла BAM, является ли подсчет для конкретной позиции генома c выше допустимого диапазона, следовательно, может указывать на наличие мутации. Для этого я бы хотел использовать модифицированный тест Томпсона Тау. Я думаю, что машинное обучение может быть использовано для этого. Итак, почему я хочу сделать все это? Ну, нормальные трубопроводы NGS работают только с вариантами с частотой 5%. Мутат ios ниже этой частоты часто пропускают. Чтобы узнать, присутствует ли мутация ниже этого уровня, вы показали погружение в выравнивание и чаще всего вручную исследует базовые вызовы. Я знаю, что это вызывает некоторые вопросы, касающиеся качества вызовов, но опять же наши традиционные тесты фактически подтвердили некоторые из этих низких мутаций. Кроме того, NGS можно использовать для определения наличия редко встречающейся мутации, которая имеет большое значение для определения измеримого остаточного заболевания после лечения.

Я новичок в r и биокондукторе, поэтому я был бы очень благодарен, если бы кто-то мог помочь мне в моей миссии по настройке сценария для этой цели.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...