Мне отправляют байты тысяч файлов через интерфейс, и мое приложение должно вести статистику, касающуюся количества различных типов файлов, которые оно наблюдает. (текст, HTML, двоичный, сжатый и т.д. .) . Я использовал модуль subprocess
для запуска утилиты file
. Однако по мере увеличения масштаба у меня возникают проблемы с производительностью из-за времени ввода-вывода, необходимого для записи и чтения байтов на диск.
Я хотел бы направить байты напрямую в file
, чтобы избежать Штраф IO. Я видел это раньше с grep
, например ls -l | grep html
. Однако я не могу заставить echo "Hello, world" | file
работать.