Question

Недавно мне пришлось обрабатывать файлы bam, сгенерированные BWA или другими инструментами выравнивания на SPARK, используя Python или Scala, как преобразовать этот двоичный файл в RDD, чтобы я мог делать некоторые статистические данные по каждой последовательности чтения и другую информацию? Может ли кто-нибудь иметь опыт или привести пример? Я немного прочитал функцию binaryRecords () PySpark и Spark-bam, которая, похоже, не работает.

Steve · Answer 1 · 31 октября 2018

Вы можете использовать PySam в Python. Смотрите документы здесь: https://pysam.readthedocs.io/en/latest/api.html

Как прочитать файл bam (выровненную информацию) в SPARK?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как прочитать файл bam (выровненную информацию) в SPARK?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы