извлечь CSV-контент из тега XML - PullRequest
0 голосов
/ 10 мая 2019

у меня есть исходный xml, как показано ниже

<rest-adapter-response>
  <metadata>
    <status>success</status>
  </metadata>
  <status-line>
    <code>200</code>
    <reason>OK</reason>
  </status-line>
  <header-lines>
    <Cache-Control>private, max-age=0</Cache-Control>
    <Transfer-Encoding>chunked</Transfer-Encoding>
    <Content-Type>application/octet-stream</Content-Type>
    <Expires>Thu, 25 Apr 2019 08:51:55 GMT</Expires>
    <Last-Modified>Fri, 10 May 2019 08:51:55 GMT</Last-Modified>
    <Server>Microsoft-IIS/10.0</Server>
    <X-SharePointHealthScore>1</X-SharePointHealthScore>
    <X-SP-SERVERSTATE>ReadOnly=0</X-SP-SERVERSTATE>
    <DATASERVICEVERSION>3.0</DATASERVICEVERSION>
    <X-Download-Options>noopen</X-Download-Options>
    <Content-Disposition>attachment</Content-Disposition>
    <SPClientServiceRequestDuration>224</SPClientServiceRequestDuration>
    <X-AspNet-Version>4.0.30319</X-AspNet-Version>
    <SPRequestGuid>de31db9e-70cb-8000-7fba-6c3e85d9c810</SPRequestGuid>
    <request-id>de31db9e-70cb-8000-7fba-6c3e85d9c810</request-id>
    <MS-CV>ntsx3stwAIB/umw+hdnIEA.0</MS-CV>
    <Strict-Transport-Security>max-age=31536000</Strict-Transport-Security>
    <X-FRAME-OPTIONS>SAMEORIGIN</X-FRAME-OPTIONS>
    <X-Powered-By>ASP.NET</X-Powered-By>
    <MicrosoftSharePointTeamServices>16.0.0.8824</MicrosoftSharePointTeamServices>
    <X-Content-Type-Options>nosniff</X-Content-Type-Options>
    <X-MS-InvokeApp>1; RequireReadOnly</X-MS-InvokeApp>
    <P3P>CP="ALL IND DSP COR ADM CONo CUR CUSo IVAo IVDo PSA PSD TAI TELo OUR SAMo CNT COM INT NAV ONL PHY PRE PUR UNI"</P3P>
    <Date>Fri, 10 May 2019 08:51:55 GMT</Date>
  </header-lines>
  <message-body>
    <non-xml-data-response>COA,COA Acct Desc,Acct Prefix,Revaluation Acct,Mapping Changes - Additions( A )  Deletions ( D ) Changes ( C ),MJE,OIM Recon,Comments for difference:10000274,"Citibank, Operating, USD, 31165975",1000,10009999,A,,X,10000374,"Citibank, Clearing, USD, 31165975",1000,10009999,A,,X,10006604,"HSBC, Operating, SAR, SA0345000000003179660002",1000,10009999,A,,X,10006605,"Citibank, Operating, ZAR, 0202099009",1000,10009999,A,,X,123,,,456,,,,</non-xml-data-response>
  </message-body>
</rest-adapter-response>

выше XML - это ответ веб-службы точки обмена, который попытался прочитать файл csv и дал такой ответ.как вы можете видеть в приведенном выше ответе xml, данные CSV пришли, но внутри одного тега xml с именем <message-body>, а также потеряли новую строку после каждого формата строки !!

Теперь мне нужно воссоздать CSV!и хуже всего то, что в инструменте, где я получаю этот формат, у меня есть возможность писать xslt и xml!нельзя использовать языковой код или библиотеки хостинга.также только xslt 1.0.

есть такой вопрос о создании csv из xml , но он немного отличается от моего требования.я только изучаю xslt и xpath, может ли кто-нибудь помочь мне в этом?

ниже запрошенный вывод: нажмите здесь, чтобы посмотреть формат csv

1 Ответ

1 голос
/ 10 мая 2019

Если допустить, что строка заголовка заканчивается двоеточием и в каждой строке данных есть 7 значений *, то можно использовать следующую таблицу стилей:

XSLT 1.0

<xsl:stylesheet version="1.0" 
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="text" encoding="UTF-8"/>

<xsl:template match="/rest-adapter-response">
    <xsl:variable name="csv" select="message-body/non-xml-data-response" />
    <!-- header -->
    <xsl:value-of select="substring-before($csv, ':')" />
    <xsl:text>:&#10;</xsl:text> 
    <!-- data -->
    <xsl:call-template name="restore-csv">
        <xsl:with-param name="text" select="substring-after($csv, ':')"/>
    </xsl:call-template>
</xsl:template>

<xsl:template name="restore-csv">
    <xsl:param name="text"/>
    <xsl:param name="i" select="1"/>
    <xsl:choose>
        <xsl:when test="contains($text, ',')">
            <xsl:variable name="value">
                <xsl:choose>
                    <xsl:when test="starts-with($text, '&quot;')">
                        <xsl:text>"</xsl:text>
                        <xsl:value-of select="substring-before(substring-after($text, '&quot;'), '&quot;')"/>
                        <xsl:text>"</xsl:text>
                    </xsl:when>
                    <xsl:otherwise>
                        <xsl:value-of select="substring-before($text, ',')"/>
                    </xsl:otherwise>
                </xsl:choose>
            </xsl:variable> 
            <!-- output -->         
            <xsl:value-of select="$value"/>
            <xsl:choose>
                <xsl:when test="$i mod 7 = 0">
                    <xsl:text>&#10;</xsl:text>
                </xsl:when>
                <xsl:otherwise>
                    <xsl:text>,</xsl:text>
                </xsl:otherwise>
            </xsl:choose>
            <!-- recursive call -->
            <xsl:call-template name="restore-csv">
                <xsl:with-param name="text">
                    <xsl:choose>
                        <xsl:when test="starts-with($text, '&quot;')">
                            <xsl:value-of select="substring-after(substring-after($text, '&quot;'), '&quot;,')"/>
                        </xsl:when>
                        <xsl:otherwise>
                            <xsl:value-of select="substring-after($text, ',')"/>
                        </xsl:otherwise>
                    </xsl:choose>
                </xsl:with-param>
                <xsl:with-param name="i" select="$i + 1"/>
           </xsl:call-template>
        </xsl:when>
        <xsl:otherwise>
            <xsl:value-of select="$text"/>
        </xsl:otherwise>
    </xsl:choose>
</xsl:template>

</xsl:stylesheet>

Применительно к вашему примеру ввода результат будет:

Результат

COA,COA Acct Desc,Acct Prefix,Revaluation Acct,Mapping Changes - Additions( A )  Deletions ( D ) Changes ( C ),MJE,OIM Recon,Comments for difference:
10000274,"Citibank, Operating, USD, 31165975",1000,10009999,A,,X
10000374,"Citibank, Clearing, USD, 31165975",1000,10009999,A,,X
10006604,"HSBC, Operating, SAR, SA0345000000003179660002",1000,10009999,A,,X
10006605,"Citibank, Operating, ZAR, 0202099009",1000,10009999,A,,X
123,,,456,,,

Это может потребоватьсябольше работы для обработки возможных экранированных двойных кавычек в кавычках.


-
(*) Странно то, что в строке заголовка есть 8 значений, но только 7 встроки данных.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...