Question

При выполнении сценариев оболочки данные обычно находятся в файлах однострочных записей, таких как csv. Это действительно просто обрабатывать эти данные с grep и sed. Но мне часто приходится иметь дело с XML, поэтому мне бы очень хотелось, чтобы скрипт мог получить доступ к этим XML-данным через командную строку. Каковы лучшие инструменты?

Russ · Answer 1 · 18 сентября 2008

Я нашел, что xmlstarlet довольно хорош в подобных вещах.

http://xmlstar.sourceforge.net/

Также должно быть доступно в большинстве дистрибутивов. Вводное руководство находится здесь:

http://www.ibm.com/developerworks/library/x-starlet.html

Joseph Holsten · Answer 2 · 18 сентября 2008

Некоторые перспективные инструменты:

nokogiri : анализ HTML / XML DOM в ruby с использованием селекторов XPath и CSS
hpricot : устарел
fxgrep : Использует собственный XPath-подобный синтаксис для запроса документов. Написано на SML, так установка может быть затруднена.
LT XML : Инструментарий XML, полученный из инструментов SGML, включая sggrep, sgsort, xmlnorm и другие. Использует собственный синтаксис запроса. Документация есть очень формально. Написано на C. LT XML 2 заявляет о поддержке XPath, XInclude и другие стандарты W3C.
xmlgrep2 : простой и мощный поиск с XPath. Написано на Perl с использованием XML :: LibXML и libxml2.
XQSharp : Поддерживает XQuery, расширение для XPath. Написано для .NET Framework.
XML-Coreutils : Инструментарий Лейрда Брейера, эквивалентный GNU coreutils. Обсуждается в интересно эссе о том, что должен включать в себя идеальный инструментарий.
xmldiff : Простой инструмент для сравнения двух XML-файлов.
xmltk : похоже, нет пакета в debian, ubuntu, fedora или macports, не выпускается с 2007 года и использует непереносимые средства автоматизации сборки. *

xml-coreutils кажется наиболее документированным и наиболее ориентированным на UNIX.

Vi. · Answer 3 · 23 июня 2010

Существует также пара xml2 и 2xml. Это позволит обычным инструментам редактирования строк обрабатывать XML.

Пример. q.xml:

<?xml version="1.0"?>
<foo>
    text
    more text
    <textnode>ddd</textnode><textnode a="bv">dsss</textnode>
    <![CDATA[ asfdasdsa <foo> sdfsdfdsf <bar> ]]>
</foo>

xml2 < q.xml

/foo=
/foo=   text
/foo=   more text
/foo=   
/foo/textnode=ddd
/foo/textnode
/foo/textnode/@a=bv
/foo/textnode=dsss
/foo=
/foo=    asfdasdsa <foo> sdfsdfdsf <bar> 
/foo=

xml2 < q.xml | grep textnode | sed 's!/foo!/bar/baz!' | 2xml

<bar><baz><textnode>ddd</textnode><textnode a="bv">dsss</textnode></baz></bar>

P.S. Есть также html2 / 2html.

bortzmeyer · Answer 4 · 04 марта 2009

К превосходному списку Джозефа Холстена я добавляю скрипт командной строки xpath, который поставляется с библиотекой Perl XML :: XPath. Отличный способ извлечь информацию из файлов XML:

 xpath -q -e '/entry[@xml:lang="fr"]' *xml

Dave Jarvis · Answer 5 · 24 января 2013

Вы можете использовать xmllint:

xmllint --xpath //title books.xml

Должен быть в комплекте с большинством дистрибутивов, а также в комплекте с Cygwin.

$ xmllint --version
xmllint: using libxml version 20900

См:

$ xmllint
Usage : xmllint [options] XMLfiles ...
        Parse the XML files and output the result of the parsing
        --version : display the version of the XML library used
        --debug : dump a debug tree of the in-memory document
        ...
        --schematron schema : do validation against a schematron
        --sax1: use the old SAX1 interfaces for processing
        --sax: do not build a tree but work just at the SAX level
        --oldxml10: use XML-1.0 parsing rules before the 5th edition
        --xpath expr: evaluate the XPath expression, inply --noout

Clay · Answer 6 · 30 июля 2013

Если вы ищете решение для Windows, Powershell имеет встроенную функциональность для чтения и записи XML.

test.xml:

<root>
  <one>I like applesauce</one>
  <two>You sure bet I do!</two>
</root>

Скрипт Powershell:

# load XML file into local variable and cast as XML type.
$doc = [xml](Get-Content ./test.xml)

$doc.root.one                                   #echoes "I like applesauce"
$doc.root.one = "Who doesn't like applesauce?"  #replace inner text of <one> node

# create new node...
$newNode = $doc.CreateElement("three")
$newNode.set_InnerText("And don't you forget it!")

# ...and position it in the hierarchy
$doc.root.AppendChild($newNode)

# write results to disk
$doc.save("./testNew.xml")

testNew.xml:

<root>
  <one>Who likes applesauce?</one>
  <two>You sure bet I do!</two>
  <three>And don't you forget it!</three>
</root>

Источник: https://serverfault.com/questions/26976/update-xml-from-the-command-line-windows

taggo · Answer 7 · 30 мая 2011

Также есть xmlsed & xmlgrep для NetBSD xmltools!

http://blog.huoc.org/xmltools-not-dead.html

Adrian Mouat · Answer 8 · 19 сентября 2008

Зависит от того, что именно вы хотите сделать.

XSLT может быть способом пойти, но есть кривая обучения. Попробуйте xsltproc и обратите внимание, что вы можете передать параметры.

Gilles Quenot · Answer 9 · 12 января 2015

Там также saxon-lint из командной строки с возможностью использования XPath 3.0 / XQuery 3.0. (Другие инструменты командной строки используют XPath 1.0).

ПРИМЕРЫ:

HTTP / HTML:

$ saxon-lint --html --xpath 'count(//a)' http://stackoverflow.com/q/91791
328

xml:

$ saxon-lint --xpath '//a[@class="x"]' file.xml

Oliver Hallam · Answer 10 · 31 октября 2008

XQuery может быть хорошим решением. Его (относительно) легко изучить, и он является стандартом W3C.

Я бы порекомендовал XQSharp для процессора командной строки.

Эквивалент Grep и Sed для обработки командной строки XML

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 12 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

ПРИМЕРЫ:

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Эквивалент Grep и Sed для обработки командной строки XML

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 12 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

ПРИМЕРЫ:

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов