Как конвертировать XML-файлы в текстовые файлы 2 - PullRequest
0 голосов
/ 31 мая 2010

У меня есть около 8000 XML-файлов, которые необходимо преобразовать в текстовые файлы. Текстовый файл должен содержать заголовок, описание и ключевые слова XML-файла без тегов, а также с удалением других элементов и атрибутов. Другими словами, мне нужно создать 8000 текстовых файлов, содержащих заголовок, описание и ключевые слова XML-файла. Мне нужно, чтобы кодирование выполнялось систематически. Любая помощь будет принята с благодарностью. Заранее спасибо.

Привет всем всем большое спасибо за ваши ответы. Вот пример того, как выглядит мой xml:

<?xml version="1.0"?>
<metadata>
<identifier>43productionsNightatthegraveyard</identifier>

<title>Night at the graveyard</title>

<collection>opensource_movies</collection>
<mediatype>movies</mediatype>
<resource>movies</resource>
<upload_application appid="ccPublisher" version="2.2.1"/>
<uploader>poncho_43productions@hotmail.com</uploader>

<description>una noche en el cementerio (terror)</description>

<license>http://creativecommons.org/licenses/by-nc/3.0/</license>
<title>Night at the graveyard</title>
  <format>Video</format>
<adder>poncho_43productions@hotmail.com</adder>
<licenseurl>http://creativecommons.org/licenses/by-nc/3.0/</licenseurl>
<year>2007</year>

<keywords>Night,at,the,graveyard,43,productions</keywords>

<holder>43 productions</holder>
<publicdate>2007-04-11 19:52:28</publicdate>
</metadata>

И это будет вывод:

una noche en el cementerio (террор)

Ночь на кладбище

Ночь, на, на, кладбище, 43, производств

Это необходимо сохранить с тем же именем, но в текстовом формате. Спасибо всем большое, если еще какие-либо предложения будут высоко оценены.

1 Ответ

0 голосов
/ 31 мая 2010

Это выглядит как довольно простой запрос XPATH , чтобы вытащить раздел описания, заголовка и ключевых слов. Поскольку вы не упомянули, какой язык программирования вы используете, я не могу предложить вам намного больше, чем этот общий процесс, описанный ниже:

  1. Загрузить документ XML и выполнить запрос xpath для заголовка (например, / metadata / title /)
  2. Повторите для описания и ключевых слов
  3. Возьмите имя файла XML, удалите имя .XML и запишите 3 вышеуказанных значения в файл и закройте его
  4. Промыть и повторить 8000 раз. :)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...