pyyaml: сброс без тегов - PullRequest
       21

pyyaml: сброс без тегов

69 голосов
/ 23 декабря 2009

у меня

>>> import yaml
>>> yaml.dump(u'abc')
"!!python/unicode 'abc'\n"

Но я хочу

>>> import yaml
>>> yaml.dump(u'abc', magic='something')
'abc\n'

Какой магический парам не заставляет помечать?

Ответы [ 5 ]

89 голосов
/ 23 декабря 2009

Вы можете использовать safe_dump вместо dump. Просто помните, что тогда он не сможет представлять произвольные объекты Python. Кроме того, когда вы load YAML, вы получите str объект вместо unicode.

18 голосов
/ 23 декабря 2009

Как насчет этого:

def unicode_representer(dumper, uni):
    node = yaml.ScalarNode(tag=u'tag:yaml.org,2002:str', value=uni)
    return node

yaml.add_representer(unicode, unicode_representer)

Это похоже на то, что дамп объектов Unicode работает так же, как и дамп объектов str для меня (Python 2.6).

In [72]: yaml.dump(u'abc')
Out[72]: 'abc\n...\n'

In [73]: yaml.dump('abc')
Out[73]: 'abc\n...\n'

In [75]: yaml.dump(['abc'])
Out[75]: '[abc]\n'

In [76]: yaml.dump([u'abc'])
Out[76]: '[abc]\n'
4 голосов
/ 21 декабря 2013

Вам нужен новый класс dumper, который делает все, что делает стандартный класс Dumper, но переопределяет представления для str и unicode.

from yaml.dumper import Dumper
from yaml.representer import SafeRepresenter

class KludgeDumper(Dumper):
   pass

KludgeDumper.add_representer(str,
       SafeRepresenter.represent_str)

KludgeDumper.add_representer(unicode,
        SafeRepresenter.represent_unicode)

Что приводит к

>>> print yaml.dump([u'abc',u'abc\xe7'],Dumper=KludgeDumper)
[abc, "abc\xE7"]

>>> print yaml.dump([u'abc',u'abc\xe7'],Dumper=KludgeDumper,encoding=None)
[abc, "abc\xE7"]

Конечно, я все еще не знаю, как сохранить эту красоту.

>>> print u'abc\xe7'
abcç

И это сломает более поздний yaml.load ()

>>> yy=yaml.load(yaml.dump(['abc','abc\xe7'],Dumper=KludgeDumper,encoding=None))
>>> yy
['abc', 'abc\xe7']
>>> print yy[1]
abc�
>>> print u'abc\xe7'
abcç
2 голосов
/ 09 ноября 2016

Небольшое дополнение к отличному ответу Interjay: вы можете сохранить свой юникод на перезагрузке, если позаботитесь о кодировках файлов.

# -*- coding: utf-8 -*-
import yaml
import codecs

data = dict(key = u"abcç\U0001F511")

fn = "test2.yaml"
with codecs.open(fn, "w", encoding="utf-8") as fo:
    yaml.safe_dump(data, fo)

with codecs.open(fn, encoding="utf-8") as fi:
    data2 = yaml.safe_load(fi)

print ("data2:", data2, "type(data.key):", type(data2.get("key")) )

print data2.get("key")

test2.yaml содержимое в моем редакторе:

{key: "abc\xE7\uD83D\uDD11"}

вывод на печать:

('data2:', {'key': u'abc\xe7\U0001f511'}, 'type(data.key):', <type 'unicode'>) abcç?

Плюс, после прочтения http://nedbatchelder.com/blog/201302/war_is_peace.html Я вполне уверен, что safe_load / safe_dump - это то место, где я хочу быть в любом случае.

0 голосов
/ 18 января 2016

Я только начал с Python и YAML, но, вероятно, это также может помочь. Просто сравните результаты:

def test_dump(self):
    print yaml.dump([{'name': 'value'}, {'name2': 1}], explicit_start=True)
    print yaml.dump_all([{'name': 'value'}, {'name2': 1}])
...