Мое предложение будет использовать Python. Вы можете использовать интерпретатор для запуска паттерна, пока вы его настраиваете, командная строка делает правильный шаг в настройке такого рода вещей. Предполагая, что xml действителен, это даст вам максимальную гибкость при минимальных хлопотах.
с учетом следующего формата xml:
<root>
<title>Document Title</title>
<content>Some document content.</content>
<keywords>test, document, keyword</keywords>
</root>
и при условии, что выходные данные каждого документа должны быть:
Document Title
Some document content.
test, document, keyword
Код Python может выглядеть примерно так:
import sys
import os
from xml.etree.ElementTree import ElementTree
def Readthexml(f):
"""Read the file from the argument list and dump the title contents and keywords"""
xcontent = ElementTree()
xcontent.parse(f)
doc = [xcontent.find("title").text, xcontent.find("content").text, xcontent.find("keywords").text]
out = open(f + ".txt", "w")
out.write("\n\n".join(doc))
return True
def main(argv=None):
if argv is None:
argv = sys.argv
args = argv[1:]
for arg in args:
if os.path.exists(arg):
Readthexml(arg)
if __name__ == "__main__":
main()
, из которого вы можете сгенерировать пакетный файл для регулярного обновления файлов (при условии, что это среда Windows, хотя python работает во всем).