Я надеюсь, что смогу отказаться от истории, но поверь мне в следующем:
- У меня есть несколько человек, которые имеют прямой доступ к MSWord 2007
- Мы пытаемся подготовить общий документ Word, который можно передать от человека к человеку
в течение нескольких месяцев, и они могут «добавлять» новый контент к нему.
Независимо от ответов ниже - вышеизложенное не изменится, независимо от того, какая это ужасная идея или какая у вас может быть лучшая идея ... Я уже шел по этому пути: P.
* * 1010
Мои «мысли» заключались в том, чтобы настроить (в Word) схему XML, чтобы мы могли «помечать» содержимое для определенных областей содержимого (например, номер элемента, описание элемента, основа элемента, параметры элемента, ответ элемента и т. Д.)
Я изучил XML-схему чуть менее чем за 6 часов, и, очевидно, я ужасный учитель: у меня есть файл XML-схемы, я импортировал его в Word, я могу пометить области, как и все онлайн учебники ...
Я НАДЕЖДА, чтобы сохранить в файл "XML" (из Word), чтобы он выглядел так:
<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
(просто извлек это из случайного сайта, чтобы продемонстрировать, что я хотел сохранить из документа word структуру XML с заполненными данными)
Была надежда, что я тогда смогу проанализировать с Python или отправить XML-файл поставщику, который затем сможет загрузить информацию в базу данных (и нет - мы не можем просто загрузить в базу данных - она должна идти из Документ Word в XML для поставщика).
Проблема: всякий раз, когда я сохраняю файл в XML из MSWord 2007, он дает мне всю эту ужасную и ужасную хрень с XML повсюду - я проверил, могу ли я разобрать это, надеясь найти встроенные теги XML, и я нахожу их, но они настолько искажены всеми тегами / дерьмом Офисов, что их разбор будет огромной тратой времени.
Наконец: как мне заставить слово автоматически заполнять теги XML (и автоматически понимая, что кто-то должен «выбрать текст», «назначить XML» ... говорить больше о «сохранении» для XML) из схемы, которую я разрабатываю (или я могу просто создать образец дерева XML без схемы?) И экспортировать содержимое, готовое для загрузки / анализа?
Спасибо за чтение моего короткого романа: P (надеюсь, я был достаточно ясен!)
-J