Как сохранить разрывы строк при экспорте из libreoffice calc в xml? - PullRequest
2 голосов
/ 05 июня 2019

Я пишу фильтры XSLT для импорта данных XML в Libreoffice-Calc, а затем экспортирую их обратно в XML после внесения изменений в Libreoffice.

В исходном XML некоторые поля содержат несколько строк.Когда я импортирую их в Libreoffice-Calc, используя мой собственный скрипт, они сохраняются и правильно отображаются в электронной таблице.Однако при экспорте данных обратно в файл xml разрывы строк удаляются.

Эти разрывы строк являются важной частью данных, которые мне нужно сохранить.Как я могу заставить их отображаться в выводе?

Некоторые вещи, которые я уже пробовал:

  • Использование «copy-of» вместо «value-of»
  • Установка атрибута disable-output-escaping для значения
  • Применение функции fn: data () к оператору select copy-of (получено сообщение об ошибке «data data not found»)

Вот пример:

import.xslt

<?xml version="1.0" encoding="UTF-8"?>

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
  <xsl:template match="/">
    <office:document-content xmlns:office="urn:oasis:names:tc:opendocument:xmlns:office:1.0" xmlns:style="urn:oasis:names:tc:opendocument:xmlns:style:1.0" xmlns:text="urn:oasis:names:tc:opendocument:xmlns:text:1.0" xmlns:table="urn:oasis:names:tc:opendocument:xmlns:table:1.0" xmlns:draw="urn:oasis:names:tc:opendocument:xmlns:drawing:1.0" xmlns:fo="urn:oasis:names:tc:opendocument:xmlns:xsl-fo-compatible:1.0" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:meta="urn:oasis:names:tc:opendocument:xmlns:meta:1.0" xmlns:number="urn:oasis:names:tc:opendocument:xmlns:datastyle:1.0" xmlns:svg="urn:oasis:names:tc:opendocument:xmlns:svg-compatible:1.0" xmlns:chart="urn:oasis:names:tc:opendocument:xmlns:chart:1.0" xmlns:dr3d="urn:oasis:names:tc:opendocument:xmlns:dr3d:1.0" xmlns:math="http://www.w3.org/1998/Math/MathML" xmlns:form="urn:oasis:names:tc:opendocument:xmlns:form:1.0" xmlns:script="urn:oasis:names:tc:opendocument:xmlns:script:1.0" xmlns:ooo="http://openoffice.org/2004/office" xmlns:ooow="http://openoffice.org/2004/writer" xmlns:oooc="http://openoffice.org/2004/calc" xmlns:dom="http://www.w3.org/2001/xml-events" xmlns:xforms="http://www.w3.org/2002/xforms" xmlns:xsd="http://www.w3.org/2001/XMLSchema" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" office:version="1.0">

      <office:body>
        <office:spreadsheet>
          <table:table>

            <!-- Rows -->
            <xsl:for-each select="top/row">
              <table:table-row>

                <table:table-cell>
                  <text:p><xsl:value-of select="column_1"/></text:p>
                </table:table-cell>

                <table:table-cell>
                  <text:p><xsl:value-of select="column_2"/></text:p>
                </table:table-cell>

              </table:table-row>
            </xsl:for-each>

          </table:table>
        </office:spreadsheet>
      </office:body>
    </office:document-content>
  </xsl:template>
</xsl:stylesheet>

export.xslt

<?xml version="1.0" encoding="UTF-8"?>

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
  xmlns:office="urn:oasis:names:tc:opendocument:xmlns:office:1.0"
  xmlns:table="urn:oasis:names:tc:opendocument:xmlns:table:1.0"
  xmlns:text="urn:oasis:names:tc:opendocument:xmlns:text:1.0"
  exclude-result-prefixes="office table text">

  <xsl:output method = "xml" indent = "yes" encoding = "UTF-8" omit-xml-declaration = "no"/>

  <xsl:template match="office:spreadsheet">
    <xsl:for-each select="table:table/table:table-row">
      <row>
        <xsl:for-each select="table:table-cell">
          <xsl:choose>

            <xsl:when test="position()=1">
              <column_1><xsl:value-of select="."/></column_1>
            </xsl:when>

            <xsl:when test="position()=2">
              <column_2><xsl:value-of select="."/></column_2>
            </xsl:when>

          </xsl:choose>
        </xsl:for-each>
      </row>
    </xsl:for-each>
  </xsl:template>

<xsl:template match="/">
  <top>
    <xsl:apply-templates select="//office:spreadsheet"/>
  </top>
</xsl:template>

</xsl:stylesheet>

xml_file.xml

<?xml version="1.0" encoding="UTF-8"?>
<top>
  <row>
    <column_1>datum 1</column_1>
    <column_2>datum 2</column_2>
  </row>
  <row>
    <column_1>datum 3
    datum 4 (should appear on line below datum 3)</column_1>
    <column_2> datum 5 </column_2>
  </row>
</top>

После открытия xml_file.xml в Libreoffice-Calc (с использованием файла импорта) внесите некоторые тривиальные изменения, а затем экспортируйте их обратно в xml_file.xml:

Ожидаемый_output.xml

<?xml version="1.0" encoding="UTF-8"?>
<top>
  <row>
    <column_1>datum 1</column_1>
    <column_2>datum 2</column_2>
  </row>
  <row>
    <column_1>datum 3
    datum 4 (should appear on line below datum 3)</column_1>
    <column_2> datum 5 </column_2>
  </row>
</top>

actual_output.xml

<?xml version="1.0" encoding="UTF-8"?>
<top>
  <row>
    <column_1>datum 1</column_1>
    <column_2>datum 2</column_2>
  </row>
  <row>
    <column_1>datum 3 datum 4 (should appear on line below datum 3)</column_1>
    <column_2> datum 5 </column_2>
  </row>
</top>

EDIT:

Хорошо, у меня есть кое-что, что работает:

<xsl:stylesheet version="1.0"
  xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
  xmlns:office="urn:oasis:names:tc:opendocument:xmlns:office:1.0"
  xmlns:table="urn:oasis:names:tc:opendocument:xmlns:table:1.0"
  xmlns:text="urn:oasis:names:tc:opendocument:xmlns:text:1.0"
  exclude-result-prefixes="office table text">
  <xsl:output method="xml" version="1.0" encoding="UTF-8" indent="yes"/>

  <xsl:template match="/office:document">
    <top>
      <xsl:for-each select="office:body/office:spreadsheet/table:table/table:table-row">
        <row>
          <xsl:for-each select="table:table-cell">
            <xsl:element name="column_{position()}">
              <xsl:for-each select="text:p">
                <xsl:apply-templates/>
                <xsl:if test="position() != last()">
                  <xsl:text>&#10;</xsl:text>
                </xsl:if>
              </xsl:for-each>
            </xsl:element>
          </xsl:for-each>
        </row>
      </xsl:for-each>
    </top>
  </xsl:template>

  <xsl:template match="text:line-break">
    <xsl:text>&#10;</xsl:text>
  </xsl:template>

</xsl:stylesheet>

Это измененная версия Майкла.Ответ hor257k, который правильно решил проблему экспорта разрывов строк, вставленных в LibreOffice.Вторая часть - это сопоставление шаблона разрыва строки, которое заботится о разрывах строк, которые уже существовали в импортированном XML.

1 Ответ

0 голосов
/ 06 июня 2019

Я не в состоянии проверить это сейчас, но попробуйте это как экспорт XSLT:

XSLT 1.0

<xsl:stylesheet version="1.0" 
xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
xmlns:office="urn:oasis:names:tc:opendocument:xmlns:office:1.0"
xmlns:table="urn:oasis:names:tc:opendocument:xmlns:table:1.0"
xmlns:text="urn:oasis:names:tc:opendocument:xmlns:text:1.0"
exclude-result-prefixes="office table text">
<xsl:output method="xml" version="1.0" encoding="UTF-8" indent="yes"/>

<xsl:template match="/office:document">
    <top>
        <xsl:for-each select="office:body/office:spreadsheet/table:table/table:table-row">
            <row>
                <xsl:for-each select="table:table-cell">
                    <xsl:element name="column_{position()}">
                        <xsl:for-each select="text:p">
                            <xsl:value-of select="."/>
                            <xsl:if test="position() != last()">
                                <xsl:text>&#10;</xsl:text>
                            </xsl:if>
                        </xsl:for-each>
                    </xsl:element>
                </xsl:for-each>
            </row>
        </xsl:for-each>
    </top>
</xsl:template>

</xsl:stylesheet>
...