Я также хотел бы сослаться на следующий пост и упомянуть, что я знаком с Bio Python.
Как получить произвольный доступ к сжатому gzip-файлу
Я знаком с потенциалом Bio.bgzf
для индексов и случайного чтения. Я создаю библиотеку, которая использует модуль для построения индекса по блокам, которые содержат данные, которые соответствуют моим интересам. Технология очень интересная, но я изо всех сил пытаюсь понять скорость развития или ограничения того, на что способны Bio.bgzf
или даже стандарт bgzf.
Может Bio.bgzf
перезаписать указанную строку c в файл, как он может читать от виртуального смещения до конца строки? Если это возможно, будут ли новые данные обязательно иметь одинаковое число битов?
После использования make_virtual_offset()
для получения позиции в файле .bgzf для строки, которую я хотел бы перезаписать, Я ищу метод, такой как filehandle.writeline()
, чтобы заменить строку в блоке новым текстом. Если это невозможно, то возможно ли получить координаты для всего блока, а затем переписать это. А если нет, то можно сказать, что индексных файлов bgzf достаточно только для чтения. Это правильно?