Я столкнулся с одной проблемой, которая больше меня. У меня есть 18 относительных больших текстовых файлов (около 30 тыс. Строк в каждом), и мне нужно подсчитать значения между пустыми ячейками во втором столбце. Вот простой пример моего файла:
Metabolism
line_1 10.2
line_2 10.1
line_3 10.3
TCA_cycle
line_4 10.7
line_5 10.8
Pyruvate_metab
line_6 100.8
На самом деле у меня около 500 строк описания (Metabolism, TCA_cycle, et c.), А диапазон строк составляет от нуля до нескольких сотен. .
Я хотел бы подсчитать значения для каждого блока (блок начинается с описания, а соответствующие строки всегда ниже), например
Metabolism 30.6
line_1 10.2
line_2 10.1
line_3 10.3
TCA_cycle 21.5
line_4 10.7
line_5 10.8
Pyruvate_metab 100.8
line_6 100.8
Или просто
30.3
21.5
100.8
Не будет проблемой, если результаты будут выводиться построчно в дополнительный файл ... Или другой альтернативный способ.
Есть одна хитрость - это описания без строк с цифрами.
Transport
line_1000 100.1
line_1001 100.2
Cell_signal
Motility
Processing
Translation
line_1002 500.1
line_1003 200.2
И даже для этих строк и хотелось бы получить значение 0.
Transport 200.3
line_1000 100.1
line_1001 100.2
Cell_signal 0
Motility 0
Processing 0
Translation 700.3
line_1002 500.1
line_1003 200.2
Остальная часть файла выглядит одинаково и согласованно - 2 столбца, разделители табуляции, описания в первом столбце , значения во втором, без пробелов (только подчеркивание).
На самом деле у меня нет опыта работы с более сложным кодированием, поэтому я действительно не знаю, как решить эту проблему в командной строке. Я уже пробовал несколько способов Excel, но это было болезненно и безуспешно.