Файлы Docx имеют размер в архиве . Единственные строки, которые вы там найдете, относятся к zip-заголовкам. Там не будет любой текст из вашего документа.
Вы можете увидеть это в Windows, изменив расширение docx
на zip
, а затем дважды щелкнув файл. Вы найдете архив с некоторым содержанием XML
, который можно открыть с помощью любого читателя Xml или даже блокнота.
Вы можете сделать то же самое вручную в коде (ie через System.IO.Compression
). типы), но вы не должны. Существуют другие библиотеки, которые уже проделали большую часть тяжелой работы для извлечения архива и уже знают, какие файлы и схемы нужно искать. Некоторые из них свободно доступны на NuGet.