Как извлечь мета-автора и заголовок из документа, экспортированного из документа Google в nodejs? - PullRequest
1 голос
/ 04 октября 2019

Я создал документ .docx в Google doc,

Используя скрипт, я хочу определить мета для:

  • author
  • title
  • date

Я уже пробовал следующие пакеты, и у меня возникли проблемы, потому что эти пакеты не работают:

Как извлечь автора мета и заголовок из документа goc doc .docx в NodeJS?

1 Ответ

1 голос
/ 04 октября 2019

Файл .docx - это просто zip-файл с другими файлами в нем. Просто найдите пакет / модуль, который может разархивировать его, и найдите файл .xml, который содержит необходимые данные. ;) Вы можете разархивировать себя и посмотреть. Я использовал 7-zip для изучения одного и нашел два файла с некоторыми данными документа в подпути docProps:

  • app.xml
  • core.xml

Уверен, есть из чего выбирать, но вот один из них: https://www.npmjs.com/package/unzip

Если вы экспортируете из документа Google, эта информация может быть не включена.

...