читать оглавление docX из C # - PullRequest
0 голосов
/ 21 мая 2019

У меня есть текстовый документ с заголовками test и indentation (с заголовком стиля 1, заголовком 2 и т. Д.)

Я хочу извлечь оглавление со всеми этими заголовками и субтитрами. Меня не очень заботит иерархия (хотя было бы неплохо)

Пока что я добавил DocX by Exceed Nuget, чтобы открыть DocX (хотя я открыт для использования других библиотек, если это необходимо), и я могу загрузить файл, используя: DocX document = DocX.Load(File.OpenRead(path));

Я могу получить все разделы с одним стилем заголовка примерно так:

 public void Load(string path)
        {
            if(File.Exists(path))
            {
                DocX document = DocX.Load(File.OpenRead(path));
                document.Paragraphs.Where(x => x.StyleName == "Heading3").ToList();

                 ;
            }
        }

Но я получаю текст без нумерации ... и это именно то, что мне нужно.

Дается слово, похожее на это:

1 Main text
 1.1 Subtest 1
 1.1.1 Details
 1.2 SubText 2

Строка, которую я написал ранее, дает мне "Main text, Subtext1, Details, ...", но я теряю нумерацию. Как я могу вывести нумерацию из узла pragraph в документе DocX?

...