Я не знаю, ищите ли вы решение или вы сами его нашли, но я отвечаю на это, надеясь, что это поможет кому-то еще искать то же самое.
Я искал решение, связанное с моей задачей, в которое я хочу преобразовать файл слова в текстовый файл.
Я пришел на этот вопрос после некоторого поиска в Google и, согласно ответу @TJD, перешел по ссылке и оттуда нашел эту ссылку .
Для моего требования, поскольку мне было необходимо преобразовать файл слова в текстовый файл. Я пошел по второй ссылке в качестве моего решения.
Поскольку файл docx создается с помощью Open XML File format
и там упоминается, я понимаю, что мне нужно распаковать файл docx, считая его zip.
Для Zip / Unzip google предоставляет код здесь . После распаковки файла docx в нашем каталоге документов по ссылке wikipedia в корневом каталоге находятся три каталога и один файл xml.
Для своего решения я выбираю каталог word
, как указано в ссылке, где находится оригинальное содержимое файла (я до сих пор не заходил ни в какой другой каталог или файл). Под вашим извлеченным путем есть файл word/doctment.xml
, в котором содержимое файла docx размещено в формате xml.
В этом xml-файле доступно много тегов, и я не знаю, что означает этот текст сейчас, но после просмотра xml-файла я обнаружил, что тег, содержащий мой текст, w:t
.
После этого каждая вещь похожа на торт. Я просто использовал NSXMLParser
и проанализировал данные из xml-файла, нацеленного на тег w:t
, и получил всю строку.
Примечание. Я обновлю свой ответ, как только узнаю о других файлах и тегах. Кроме того, это решение не работает с файлами doc, насколько я знаю, OpenXMLFile format
введено в MSOffice 2007, поэтому я также обновлю свой ответ для решения doc file.
Я знаю, что этого недостаточно, чтобы не охватывать создание файла документации и т. Д. Но я надеюсь, что это поможет многим из нас.