тройник испортил выходной файл для большого вывода - PullRequest
0 голосов
/ 21 декабря 2018

Я запускаю программу dsk2ascii, которая читает файл h5 и печатает информацию в файл в виде строк:

AAAAAAAATTTGAGAAATTGAGAAATTATAT 2
AAAAAAATTTGAGAAATTGAGAAATTATATA 10
AAAAAATTTGTAAATTGTTTTTTAATGACAA 2
AAAAACAGGATAAATTACATCTTTTGGATAA 2

(последовательность фиксированной длины, пробел и затем число)

Теперь я хотел напечатать это в файл, но добавив результаты последующих вызовов.Поэтому мой вызов выглядит следующим образом:

dsk2ascii -file testsample.h5 -out /dev/stdout |tee - >> outfile

-out /dev/stdout приведет к выводу dsk2ascii для вывода на стандартный вывод.|tee - Я должен был добавить, потому что в противном случае мой outfile обрезался каждый раз (несмотря на использование >>)

Для 42 последующих вызовов я получаю очень большой (600 ГБ) выходной файл,В этом выходном файле 99,99% строк полностью в порядке, но для некоторых я испортил результат.У меня будут слишком короткие последовательности, пробел отсутствует, или есть дополнительные переводы строк.

Это некоторое переполнение буфера из-за больших входных и выходных данных и, если да, как я могу избежать этого?

...