XQuery / XPath: использование функций count () и max () для возврата элемента с наибольшим количеством - PullRequest
7 голосов
/ 01 декабря 2011

У меня есть XML-файл, который содержит авторов и редакторов.

<?xml version="1.0" encoding="UTF-8"?>
<?oxygen RNGSchema="file:textbook.rnc" type="compact"?>
<books xmlns="books">

    <book ISBN="i0321165810" publishername="OReilly">
        <title>XPath</title>
        <author>
            <name>
                <fname>Priscilla</fname>
                <lname>Walmsley</lname>
            </name>
        </author>
        <year>2007</year>
        <field>Databases</field>
    </book>

    <book ISBN="i0321165812" publishername="OReilly">
        <title>XQuery</title>
        <author>
           <name>
               <fname>Priscilla</fname>
               <lname>Walmsley</lname>
            </name>
        </author>
        <editor>
            <name>
                <fname>Lisa</fname>
                <lname>Williams</lname>
            </name>
        </editor>
        <year>2003</year>
        <field>Databases</field>
    </book>

    <publisher publishername="OReilly">
        <web-site>www.oreilly.com</web-site>
        <address>
            <street_address>hill park</street_address>
            <zip>90210</zip>
            <state>california</state>
        </address>
        <phone>400400400</phone>
        <e-mail>oreilly@oreilly.com</e-mail>
        <contact>
            <field>Databases</field>
            <name>
                <fname>Anna</fname>
                <lname>Smith</lname>
            </name>
        </contact>
    </publisher>
</books>

Я ищу способ вернуть человека, который был отмечен чаще всего в качестве автора и / или редактора.Решение должно быть совместимо с XQuery 1.0 (XPath 2.0).

Я думал об использовании запроса FLWOR для перебора всех авторов и редакторов, затем подсчета уникальных авторов / редакторов, а затем возвращения автора/ / редактор (ы), которые соответствуют наибольшему количеству.Но я не смог найти правильного решения.

Кто-нибудь есть какие-либо предложения о том, как такой запрос FLWOR будет написан?Можно ли сделать это проще, используя XPath?

С наилучшими пожеланиями,

Жанетт

Ответы [ 4 ]

16 голосов
/ 01 декабря 2011

Это может помочь:

declare default element namespace 'books';
(for $name in distinct-values($doc/books/*/*/name)
 let $entries := $doc/books/*[data(*/name) = $name]
 order by count($entries) descending
 return $entries/*/name)[1]
7 голосов
/ 01 декабря 2011

Вот чистое выражение XPath 2.0, правда, не для слабонервных :

(for $m in max(for $n in distinct-values(/*/b:book/(b:author | b:editor)
                                        /b:name/concat(b:fname, '|', b:lname)),
               $cnt in count(/*/b:book/(b:author | b:editor)
                             /b:name[$n eq concat(b:fname, '|', b:lname) ])
               return $cnt
               ),
     $name in /*/b:book/(b:author | b:editor)/b:name,
     $fullName in $name/concat(b:fname, '|',  b:lname),
     $count in count( /*/b:book/(b:author | b:editor)
                   /b:name[$fullName eq concat(b:fname, '|',  b:lname)])
  return
     if($count eq $m)
       then $name
       else ()
   )[1]

, где префикс "b:" связан с пространством имен "books".

XSLT 2.0 - проверка на основе :

<xsl:stylesheet version="2.0"
 xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
 xmlns:b="books">
 <xsl:output omit-xml-declaration="yes" indent="yes"/>
 <xsl:strip-space elements="*"/>

 <xsl:template match="/">
   <xsl:sequence select=
   "(for $m in max(for $n in distinct-values(/*/b:book/(b:author | b:editor)
                                            /b:name/concat(b:fname, '|', b:lname)),
                   $cnt in count(/*/b:book/(b:author | b:editor)
                                 /b:name[$n eq concat(b:fname, '|', b:lname) ])
                   return $cnt
                   ),
         $name in /*/b:book/(b:author | b:editor)/b:name,
         $fullName in $name/concat(b:fname, '|',  b:lname),
         $count in count( /*/b:book/(b:author | b:editor)
                       /b:name[$fullName eq concat(b:fname, '|',  b:lname)])
      return
         if($count eq $m)
           then $name
           else ()
       )[1]
   "/>
 </xsl:template>
</xsl:stylesheet>

когда это преобразование применяется к предоставленному документу XML :

<books xmlns="books">
    <book ISBN="i0321165810" publishername="OReilly">
        <title>XPath</title>
        <author>
            <name>
                <fname>Priscilla</fname>
                <lname>Walmsley</lname>
            </name>
        </author>
        <year>2007</year>
        <field>Databases</field>
    </book>
    <book ISBN="i0321165812" publishername="OReilly">
        <title>XQuery</title>
        <author>
            <name>
                <fname>Priscilla</fname>
                <lname>Walmsley</lname>
            </name>
        </author>
        <editor>
            <name>
                <fname>Lisa</fname>
                <lname>Williams</lname>
            </name>
        </editor>
        <year>2003</year>
        <field>Databases</field>
    </book>
    <publisher publishername="OReilly">
        <web-site>www.oreilly.com</web-site>
        <address>
            <street_address>hill park</street_address>
            <zip>90210</zip>
            <state>california</state>
        </address>
        <phone>400400400</phone>
        <e-mail>oreilly@oreilly.com</e-mail>
        <contact>
            <field>Databases</field>
            <name>
                <fname>Anna</fname>
                <lname>Smith</lname>
            </name>
        </contact>
    </publisher>
</books>

желаемый, правильный name элемент выбран и выведен :

<name xmlns="books">
   <fname>Priscilla</fname>
   <lname>Walmsley</lname>
</name>
4 голосов
/ 01 декабря 2011

Я всегда чувствовал, что это было упущением в XPath: функции max () и min () возвращают самое высокое / самое низкое значение, тогда как обычно вы хотите, чтобы объект (ы) в коллекции имели самый высокий самое низкое значение для некоторого выражения. Одно из решений состоит в том, чтобы отсортировать объекты по этому значению и взять первый / последний из списка, что выглядит не элегантно. Вычисление мин / макс, а затем выбор элементов, значение которых соответствует этому, кажется одинаково непривлекательным. В Saxon уже давно существует пара функций расширения высшего порядка saxon: Самый высокий () и saxon: lower (), которые принимают последовательность и функцию и возвращают элемент (ы) из последовательности, имеющей самое низкое или самое высокое результат функции. Хорошей новостью является то, что в XPath 3.0 вы можете написать эти функции самостоятельно (на самом деле они приведены в качестве примера пользовательских функций в спецификации).

2 голосов
/ 01 декабря 2011

Вы на правильном пути.Самый простой способ - преобразовать имена в строки (например, через пробел) и использовать их: (Обратите внимание, что следующий код не проверен)

let $names := (//editor | //author)/concat(fname, ' ', lname)
let $distinct-names := distinct-values($names)
let $name-count := for $name in $distinct-names return count($names[. = $name])
for $name at $pos in $distinct-names
where $name-count[$pos] = max($name-count)
return $name

Или другой подход:

(
  let $people := (//editor | //author)
  for $person in $people
  order by count($people[fname = $person/fname and
                         lname = $person/lname])
  return $person
)[last()]
...