Excel в XML для извлечения данных - PullRequest
1 голос
/ 15 октября 2010

Я пытаюсь удалить данные из тысяч идентичных файлов Excel 2007/2010.Я бы предпочел сделать это, используя методы очистки.Можно ли поцарапать файл Excel, поскольку, насколько я знаю, файл в основном представляет собой какой-то формат XML.

Итак, возможно ли преобразовать файл Excel в XML или другой формат разметки?

Ответы [ 2 ]

1 голос
/ 15 октября 2010

Формат XLSX на самом деле представляет собой ZIP-файл, но с другим расширением.Если вы разархивируете его, используя вашу любимую программу zip, вы обнаружите, что данные листа находятся внутри xl \ worksheets.Каждый лист сохраняется как отдельный документ XML.Вы должны быть в состоянии использовать XSLT, как предлагал Майкл, для извлечения необходимых вам данных.

0 голосов
/ 15 октября 2010

Файлы Excel 2010 по умолчанию представлены в формате XML. Итак, в каком формате находятся ваши файлы Excel (т.е. какое у них расширение)? Ваш вопрос несколько двусмысленен по этому вопросу. Если они уже есть в XML, вы можете использовать XSLT для их очистки.

...