Как мне разобрать текст из файла docx?
Я уже пробовал Data(contentsOf:) и String(contentsOf:), но ничего не получалось.
Data(contentsOf:)
String(contentsOf:)
Это нельзя сделать с помощью Data(contentsOf:) или String(contentsOf:), поскольку формат .docx - это сжатый формат, состоящий из xml и других файлов. Чтобы разобрать текст из файла .docx, необходимо распаковать файл do c. В моем случае я использовал ZIPFoundation , чтобы распаковать документ. Выполните синтаксический анализ файла с именем word/document.xml в пути извлечения, используя любой анализатор XML, и вы сможете получить текст из документа.
.docx
word/document.xml
Источники:
Преобразование файлов Docx в текст в Swift
Чтение или преобразование слов .do c файлов iOS