Я запускаю программу dsk2ascii, которая читает файл h5 и печатает информацию в файл в виде строк:
AAAAAAAATTTGAGAAATTGAGAAATTATAT 2
AAAAAAATTTGAGAAATTGAGAAATTATATA 10
AAAAAATTTGTAAATTGTTTTTTAATGACAA 2
AAAAACAGGATAAATTACATCTTTTGGATAA 2
(последовательность фиксированной длины, пробел и затем число)
Теперь я хотел напечатать это в файл, но добавив результаты последующих вызовов.Поэтому мой вызов выглядит следующим образом:
dsk2ascii -file testsample.h5 -out /dev/stdout |tee - >> outfile
-out /dev/stdout
приведет к выводу dsk2ascii
для вывода на стандартный вывод.|tee -
Я должен был добавить, потому что в противном случае мой outfile
обрезался каждый раз (несмотря на использование >>
)
Для 42 последующих вызовов я получаю очень большой (600 ГБ) выходной файл,В этом выходном файле 99,99% строк полностью в порядке, но для некоторых я испортил результат.У меня будут слишком короткие последовательности, пробел отсутствует, или есть дополнительные переводы строк.
Это некоторое переполнение буфера из-за больших входных и выходных данных и, если да, как я могу избежать этого?