Как проверить, что атрибуты xml не должны содержать информацию о часовом поясе с помощью Schematron? - PullRequest
1 голос
/ 13 марта 2012

Как мне проверить, что все атрибуты XML с подписью не должны содержать информацию о часовом поясе с помощью Schematron?Я использую реализацию .NET, которая использует XPath 1.0.

Данный исходный XML:

<?xml version="1.0" encoding="utf-8"?>
<MyData versionDate="2010-12-09" dataBeginDate="2012-03-01" dataEndDate="2012-03-10" extractedWhen="2012-03-09T10:08:40">
  <Site Site_key="999">
    <SitePatient Patient_key="1">
    <txt_Surname value="TEST" signedWhen="2012-03-08T22:02:39" signedWho="SomeName"/>
    <txt_GivenNames value="PATIENT" signedWhen="2012-03-08T22:02:39" signedWho="SomeName"/>
    <dat_BirthDate value="2010-06-15" signedWhen="2012-03-08T22:02:39" signedWho="SomeName"/>
    <sel_Status value="Enrolled" signedWhen="2012-03-08T22:02:39" signedWho="SomeName"/>
    <dat_StatusDate value="2012-03-05-05:00" signedWhen="2012-03-08T22:02:39" signedWho="SomeName"/>
    </SitePatient>
  </Site>
</MyData>

Использование этого правила Schematron в файле XSD:

<xs:annotation>
<xs:appinfo>
  <sch:pattern name="All signedWhen TimeZone constraints">
  <sch:rule context="*[@signedWhen]">
  <sch:assert test="(substring(@signedWhen,11,12) != '-') and (substring(@signedWhen,11,12) != '+') and (substring(@signedWhen,11,12) != 'Z')">
       <name/> must not include TimeZone information
    </sch:assert>
  </sch:rule>
  </sch:pattern> 
</xs:appinfo>  
</xs:annotation>

Дает эти неверные результаты

Он не должен возвращать никаких результатов, поскольку информация о часовом поясе отсутствует.

NMatrix.Schematron.ValidationException: Results from Schematron validation:
Results from Schematron validation
From pattern "All signedWhen TimeZone constraints"
Assert fails: txt_Surname must not include TimeZone information
At: /MyData[1]/Site[1]/SitePatient[1]/txt_Surname[1]
    <txt_Surname value="TEST" signedWhen="2012-03-08T22:02:39" signedWho="SomeName">...</txt_Surname>
    (Line: 5, Column: 6)
Assert fails: txt_GivenNames must not include TimeZone information
At: /MyData[1]/Site[1]/SitePatient[1]/txt_GivenNames[1]
    <txt_GivenNames value="PATIENT" signedWhen="2012-03-08T22:02:39" signedWho="SomeName">...</txt_GivenNames>
    (Line: 6, Column: 6)
Assert fails: dat_BirthDate must not include TimeZone information
At: /MyData[1]/Site[1]/SitePatient[1]/dat_BirthDate[1]
    <dat_BirthDate value="2010-06-15" signedWhen="2012-03-08T22:02:39" signedWho="SomeName">...</dat_BirthDate>
    (Line: 7, Column: 6)
Assert fails: sel_Status must not include TimeZone information
At: /MyData[1]/Site[1]/SitePatient[1]/sel_Status[1]
    <sel_Status value="Enrolled" signedWhen="2012-03-08T22:02:39" signedWho="SomeName">...</sel_Status>
    (Line: 8, Column: 6)
Assert fails: dat_StatusDate must not include TimeZone information
At: /MyData[1]/Site[1]/SitePatient[1]/dat_StatusDate[1]
    <dat_StatusDate value="2012-03-05-05:00" signedWhen="2012-03-08T22:02:39" signedWho="SomeName">...</dat_StatusDate>
    (Line: 9, Column: 6)

РЕДАКТИРОВАТЬ 1:

Я понял это.В моих тестах неправильно использовалась подстрока функции XPath 1.0.

<sch:assert test="(substring(@signedWhen, 11, 1) != '-') and (substring(@signedWhen, 11, 1) != '+') and (substring(@signedWhen, 11, 1) != 'Z')">

РЕДАКТИРОВАТЬ 2: W3schools определение xs: date и xs: dateTime не упомянуло возможность отрицательно подписанного года с подписью.Так что мой код выше не будет работать, см. Ответ, выбранный ниже.

РЕДАКТИРОВАТЬ 3: Хорошо схема, которую я использую (xmlns: xs = "http://www.w3.org/2001/XMLSchema"), не принимает отрицательныйподписанный год - и объявляет его недействительным. Но для безопасности я буду использовать этот код с этого момента:

<sch:assert test="not ( (contains(substring(@signedWhen, 11, 2), '-')) or (contains(@signedWhen, '+')) or (contains(@signedWhen, 'Z')) )">

1 Ответ

1 голос
/ 15 марта 2012

Я не знаю, хотите ли вы обрабатывать дату или дату и время, но когда я увижу ваш код, возможно, и то, и другое.Ваш код не будет работать в некоторых конкретных случаях.

Учитывая спецификацию dateTime :

Лексическое пространство · dateTime состоит из последовательностей конечной длинысимволов вида: '-'?гггг '-' мм '-' дд 'т' чч ':' мм ':' сс ('.' с +)?(zzzzzz) ?, где ...

Подробнее можно прочитать дальше.Часть (zzz)? является часовым поясом и имеет следующий вид (тот же источник):

Лексическое представление часового пояса представляет собой строку вида: (('+' | '-') hh':' мм) |'Z', где ...

Таким образом, ваш код не будет работать для даты или даты-времени, например: -2010-03-08Z или 2010-03-08T12:01:02.2Z, например.

Этот долженбыть более общим (и XPath 1.0):

test="not(
            contains(@signedWhen,'+') 
            or contains(@signedWhen,'Z') 
            or (contains(@signedWhen, 'T') 
                 and contains(substring-after(@signedWhen ,':'),'-'))
            or (not(contains(@signedWhen,'T')) and contains(@signedWhen,':'))
            )"
...