Какой формат файла конфигурации использовать для удобных для пользователя строк произвольных байтов? - PullRequest
2 голосов
/ 13 марта 2012

Итак, я сделал короткий скрипт на Python для запуска файлов в Windows с неоднозначными расширениями, изучив их магическое число / подпись файла first:

Я бы хотел скомпилировать его в .exe, чтобы упростить ассоциацию (используя bbfreeze или переписать на C), но мне нужен какой-то удобный для пользователя файл конфигурации, чтобы указать соответствующие строки байтов и пути к программам. По сути, я хочу как-то поместить эту информацию в простой текстовый файл:

magic_numbers = {
# TINA
'OBSS': r'%PROGRAMFILES(X86)%\DesignSoft\Tina 9 - TI\TINA.EXE',

# PSpice
'*version': r'%PROGRAMFILES(X86)%\Orcad\Capture\Capture.exe', 
'x100\x88\xce\xcf\xcfOrCAD ': '', #PSpice?

# Protel
'DProtel': r'%PROGRAMFILES(X86)%\Altium Designer S09 Viewer\dxp.exe', 

# Eagle
'\x10\x80': r'%PROGRAMFILES(X86)%\EAGLE-5.11.0\bin\eagle.exe',
'\x10\x00': r'%PROGRAMFILES(X86)%\EAGLE-5.11.0\bin\eagle.exe',
'<?xml version="1.0" encoding="utf-8"?>\n<!DOCTYPE eagle ': r'%PROGRAMFILES(X86)%\EAGLE-5.11.0\bin\eagle.exe',

# PADS Logic
'\x00\xFE': r'C:\MentorGraphics\9.3PADS\SDD_HOME\Programs\powerlogic.exe', 
}

(Шестнадцатеричные байты - это просто произвольные байты, а не символы Юникода.)

Я полагаю, что файл .py в этом формате работает, но я должен оставить его некомпилированным и каким-то образом импортировать его в скомпилированный файл, и есть еще куча постороннего содержимого, такого как { и ,, которое нужно перепутать по / винт.

Я посмотрел на YAML, и это было бы здорово, за исключением того, что сначала он требует двоичного кода в кодировке base64, а это не совсем то, чего я хочу. Я бы предпочел, чтобы файл конфигурации содержал шестнадцатеричные представления байтов. Но также представления ASCII, если это все, что подпись файла. И, возможно, также регулярные выражения. : D (Например, если формат на основе XML можно записать с разным количеством пробелов)

Есть идеи?

Ответы [ 3 ]

1 голос
/ 13 марта 2012

Вы уже получили свой ответ: YAML.

Данные, которые вы разместили выше, хранят текстовые представления двоичных данных;это будет хорошо для YAML, вам просто нужно разобрать его правильно.Обычно вы используете что-то из модуля binascii;в этом случае, скорее всего, функция binascii.a2b_qp.

magic_id_str = 'x100\x88\xce\xcf\xcfOrCAD '
magic_id = binascii.a2b_qp(magic_id_str)

Для пояснения я буду использовать символ Юникода в качестве простого способа вставки двоичных данных в REPL (Python 2.7):

>>> a = 'Φ'  
>>> a  
'\xce\xa6'  
>>> binascii.b2a_qp(a)  
'=CE=A6'  
>>> magic_text = yaml.load("""  
... magic_string: '=CE=A6'  
... """)  
>>> magic_text  
{'magic_string': '=CE=A6'}  
>>> binascii.a2b_qp(magic_text['magic_string'])  
'\xce\xa6'  
1 голос
/ 14 марта 2012

Я бы предложил сделать это немного по-другому. Я бы отделил эти две настройки друг от друга:

  1. Подпись магического числа ===> mimetype
  2. mimetype ==> программа запуска

Для первой части я бы использовал python-magic , библиотеку, которая имеет привязки к libmagic . Вы можете использовать python-magic, используя собственный магический файл, подобный этому:

import magic
m = magic.Magic(magic_file='/path/to/magic.file')

Ваши пользователи могут указать пользовательский магический файл, отображающий магические числа в миметипы. Синтаксис магических файлов задокументирован . Вот пример, показывающий волшебный файл для формата TIFF:

# Tag Image File Format, from Daniel Quinlan (quinlan@yggdrasil.com)
# The second word of TIFF files is the TIFF version number, 42, which has
# never changed.  The TIFF specification recommends testing for it.
0       string          MM\x00\x2a      TIFF image data, big-endian
!:mime  image/tiff
0       string          II\x2a\x00      TIFF image data, little-endian
!:mime  image/tiff

Вторая часть довольно проста, поскольку вам нужно только указать текстовые данные. Вы можете использовать формат INI или yaml, как это предлагают другие, или вы можете даже получить простой файл с разделителями табуляции, например:

image/tiff         C:\Program Files\imageviewer.exe
application/json   C:\Program Files\notepad.exe
0 голосов
/ 13 марта 2012

Я использовал несколько пакетов для создания файлов конфигурации, в том числе yaml. Я рекомендую вам использовать ConfigParser или ConfigObj.

Наконец, лучший вариант Если вы хотите создать понятный человеку файл конфигурации с комментариями, я настоятельно рекомендую использовать ConfigObj.

Наслаждайтесь!

Пример ConfigObj

С этим кодом:

Вы также можете использовать ConfigObj для их хранения. Попробуй это: импорт configobj

def createConfig(path):
    config = configobj.ConfigObj()
    config.filename = path
    config["Sony"] = {}
    config["Sony"]["product"] = "Sony PS3"
    config["Sony"]["accessories"] = ['controller', 'eye', 'memory stick']
    config["Sony"]["retail price"] = "$400"
    config["Sony"]["binary one"]= bin(173)
    config.write()

Вы получаете этот файл:

[Sony]
product = Sony PS3
accessories = controller, eye, memory stick
retail price = $400
binary one = 0b10101101
...