Использование python для генерации XML из таблиц SQL - PullRequest
1 голос
/ 10 ноября 2010

У меня есть XML-код следующим образом:

<dd>
    <persson>
        <name>sam</name>
        <tel>9748</tel>
    </persson>
    <cat>
        <name>frank</name>
    </cat>
</dd>

Я разбил его на две таблицы SQL, одну для тегов и одну для pcdata. Столбцы начала и окончания представляют позицию, в которой тег появляется и заканчивается.

Tags:
 start | stop |  tag   
-------+------+--------
     3 |    5 | name
     6 |    8 | tel
     2 |    9 | persson
    11 |   13 | name
    10 |   14 | cat
     1 |   15 | dd
(6 rows)

Pcdata:
 pos | pcdata 
-----+--------
   4 | sam
   7 | 9748
  12 | frank
(3 rows)

Теперь я хотел бы проанализировать эту базу данных обратно в XML в исходном виде. Я хочу написать функцию, которая берет обе таблицы и записывает XML в файл. Для этого я использую python и psycopg2.

Ответы [ 3 ]

3 голосов
/ 10 ноября 2010

Хммм, расшифровав ваши "колонки":

<dd><persson><name>sam</name><tel>9748</tel></persson>
1   2        3     4  5      6    7   8     9                    
<cat><name>frank</name></cat></dd>
10   11    12   13     14    15

У меня есть к вам несколько вопросов: как вы это сделали?Почему ты это сделал?Что именно вы хотите достичь?Обратите внимание, что заголовок вашего вопроса вводит в заблуждение - «таблицы SQL» - это просто место, где вы припарковали свое своеобразное представление данных.

Вот какой-то псевдокод для выполнения того, что вы хотите сделать:

pieces = []
result = cursor.execute("select * from tags;")
for start, step, tag in result:
    pieces.append((start, "<" + tag + ">"))
    pieces.append((stop, "</" + tag + ">"))
result = cursor.execute("select * from pcdata;")
for pos, pcdata in result:
    pieces.append((pos, pcdata))
pieces.sort()
xml_stream = "".join(piece[1] for piece in pieces)
your_file_object.write(xml_stream)

В ответ на вопрос о том, поместит ли вышеперечисленное «позиции» в выходной поток: нет, не будет;следующий фрагмент показывает, что это работает.Позиции используются только для сортировки супа в правильном порядке.В «объединении» piece[0] относится к позиции, но она не используется, только piece[1], который является обязательным текстом.

>>> pieces
[(3, '<name>'), (4, 'sam'), (5, '</name>')]
>>> ''.join(piece[1] for piece in pieces)
'<name>sam</name>'

Смена комментария-вопроса SQL:

Хотя показано с SQLite, это стандартный болотный SQL.Если ваша база данных не использует || в качестве оператора конкатенации, попробуйте +.

Вопрос, который вы забыли задать: «Как мне получить <?xml blah-blah ?> штучку впереди?».Ответ: см. Ниже.

console-prompt>sqlite3
SQLite version 3.6.14
Enter ".help" for instructions
Enter SQL statements terminated with a ";"
sqlite> create table tags (start int, stop int, tag text);
sqlite> insert into tags values(3,5,'name');
sqlite> insert into tags values(6,8,'tel');
sqlite> insert into tags values(2,9,'persson');
sqlite> insert into tags values(11,13,'name');
sqlite> insert into tags values(10,14,'cat');
sqlite> insert into tags values(1,15,'dd');
sqlite> create table pcdata (pos int, pcdata text);
sqlite> insert into pcdata values(4,'sam');
sqlite> insert into pcdata values(7,'9748');
sqlite> insert into pcdata values(12,'frank');
sqlite> select datum from (
   ...>     select 0 as posn, '<?xml version="1.0" encoding="UTF-8"?>' as datum
   ...>     union
   ...>     select start as posn, '<' || tag || '>' as datum from tags
   ...>     union
   ...>     select stop as posn, '</' || tag || '>' as datum from tags
   ...>     union
   ...>     select pos as posn, pcdata as datum from pcdata
   ...>     )
   ...> order by posn;
<?xml version="1.0" encoding="UTF-8"?>
<dd>
<persson>
<name>
sam
</name>
<tel>
9748
</tel>
</persson>
<cat>
<name>
frank
</name>
</cat>
</dd>
sqlite>
1 голос
/ 10 ноября 2010

Прежде всего, если Postgres включает механизмы для создания XML для вас, используйте их.

Во-вторых, не используйте манипуляции со строками для создания XML, если вы действительно не знаете, что делаете. И даже тогда нет. Простое объединение строковых значений из вашей базы данных приведет к получению плохо сформированного XML, если, например, в каком-либо столбце есть амперсанд.

Если вы не будете обрабатывать слишком много данных, чтобы поместиться в памяти, используйте подход Джона Мачина для разбивки данных на элементы и lxml.etree для создания реальных элементов XML.

1 голос
/ 10 ноября 2010

Простой ответ - нет.Если вы используете Postgres 8.3 или выше, создайте XML, используя SQL.Это будет намного проще.

http://www.postgresql.org/docs/current/static/functions-xml.html

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...