Tcpflow выводит кучу файлов, многие из которых являются HTTP-ответами от веб-сервера. Внутри они содержат заголовки HTTP, включая Content-type: и другие важные. Я пытаюсь написать сценарий, который может извлекать только данные полезной нагрузки (например, image / jpeg; text / html; и др.) И сохранять их в файл [необязательно: с соответствующим именем и расширением файла].
Символами EOL являются \ r \ n (CRLF), и поэтому их сложно использовать в дистрибутивах GNU (по моему опыту).
Я пробовал что-то вроде:
sed /HTTP/,/^$/d
Удалить весь текст от начала HTTP (вкл.) До конца \ r \ n \ r \ n (вкл.), Но я не нашел удачи. Я ищу помощь от любого с хорошим опытом в sed
и / или awk
. У меня нет опыта работы с Perl, пожалуйста, я бы предпочел использовать обычные утилиты командной строки GNU для этого
Найдите пример выходного файла tcpflow здесь. (плохая ссылка)
Спасибо
Фелипе