У меня найдена довольно сложная программа gawk:
https://bitbucket.org/bytesumo/bytefreq/src/master/bytefreq_v1.04.awk
и я хотел бы докертизировать его, но не уверен в том, что наилучший подход к нему позволяет поддерживать его удобство использования.
В настоящее время он принимает локальные данные в качестве входных данных либо через дескриптор файла, либо читает из STDIN. Кроме того, он принимает во время выполнения несколько пользовательских опций командной строки, включая те, которые установлены с использованием синтаксиса -v. В идеале вывод должен быть обработан изящно, либо возвращен в виде файла, либо обратно в STDOUT.
Любые стратегии или советы были бы наиболее полезными и, вероятно, применимы и ко многим другим программам gawk.
Чтобы попробовать и запустить пример:
$ git clone https://bitbucket.org/bytesumo/bytefreq.git
$ cd bytefreq
$ gawk -F"\t" -f bytefreq_v1.04.awk -v header="1" -v report="1" -v grain="L" testdata.tab > output.report.txt
$ cat output.report.txt
большое спасибо