Функция безопасного выхода для вывода терминала - PullRequest
1 голос
/ 13 января 2009

Я ищу эквивалент urlencode для вывода на терминал - мне нужно убедиться, что мусорные символы, которые я (возможно) печатаю из внешнего источника, не заканчивают тем, что делают прикольные вещи с мой терминал, так что предварительно упакованная функция для экранирования специальных последовательностей символов была бы идеальной.

Я работаю в Python, но все, что я могу легко перевести, тоже работает. ТИА!

Ответы [ 4 ]

3 голосов
/ 13 января 2009

К сожалению, «вывод терминала» является очень плохо определенным критерием для фильтрации (см. вопрос 418176 ). Я бы посоветовал просто внести в белый список символы, которые вы хотите разрешить (которых будет большая часть string.printable), и заменить все остальные на любой экранированный формат, какой вам нравится (\ FF,% FF и т. Д.), Или даже просто удалить их.

2 голосов
/ 13 января 2009
$ ./command | cat -v

$ cat --help | grep nonprinting
-v, --show-nonprinting   use ^ and M- notation, except for LFD and TAB

Вот то же самое в py3k на основе android / cat.c :

#!/usr/bin/env python3
"""Emulate `cat -v` behaviour.

use ^ and M- notation, except for LFD and TAB

NOTE: python exits on ^Z in stdin on Windows
NOTE: newlines handling skewed towards interactive terminal. 
      Particularly, applying the conversion twice might *not* be a no-op
"""
import fileinput, sys

def escape(bytes):
    for b in bytes:
        assert 0 <= b < 0x100

        if  b in (0x09, 0x0a): # '\t\n' 
            yield b
            continue

        if  b > 0x7f: # not ascii
            yield 0x4d # 'M'
            yield 0x2d # '-'
            b &= 0x7f

        if  b < 0x20: # control char
            yield 0x5e # '^'
            b |= 0x40
        elif  b == 0x7f:
            yield 0x5e # '^'
            yield 0x3f # '?'
            continue

        yield b

if __name__ == '__main__':
    write_bytes = sys.stdout.buffer.write 
    for bytes in fileinput.input(mode="rb"):
        write_bytes(escape(bytes))

Пример:

$ perl -e"print map chr,0..0xff" > bytes.bin 
$ cat -v bytes.bin  > cat-v.out 
$ python30 cat-v.py bytes.bin > python.out
$ diff -s cat-v.out python.out 

Он печатает:

Files cat-v.out and python.out are identical
1 голос
/ 14 января 2009

При записи в журнал или распечатке результатов отладки я обычно использую repr(), чтобы получить безобидную версию объекта для печати, включая строки. Это может или не может быть то, что вы хотели; cat --show-nonprinting метод, который другие использовали в других ответах, лучше для многострочного вывода.

x = get_weird_data()
print repr(x)
0 голосов
/ 13 января 2009

Вы могли бы передать это через строки

./command | strings

Это исключит не строковые символы

...