Я искал решение для этого, большинство ответов просто, что это невозможно.Я видел, что Paged.js (рассматривал возможность его использования, но он казался слишком большим и нецелевым) умудряется использовать
a::after { content: target-counter(attr(href), page, decimal); }
, меняя содержимое там, чтобы заполнить правильную страницуномера для ToC.Я предполагаю, что это означает, что они создали css-polyfill, который исправляет это в своей библиотеке?Похоже, что браузеры не поддерживают target-counter и :: after.Я не уверен, правильно ли я здесь размышляю - но я искал polyfill для css, чтобы заставить работать счетчик целей и для меня (и page-break-after: избежать), так как paged.js, кажется, делаетэто так.
В любом случае, второй вариант, который я рассмотрел, - это использование парсера PDF для анализа всех данных в pdf, и каким-то образом использовать регулярные выражения и циклы и другие хакерские вещи, чтобы найтиномера страниц элементов, которые я ищу.Может быть, я бы поместил возвращаемое значение синтаксического анализатора в файл JSON и получил этот файл JSON из оглавления или что-то еще?Звучит медленно, так как мне также придется объединить PDF еще раз.(Делая это один раз уже для главной страницы)
Чтобы быть немного конкретнее: я хотел бы знать, возможно ли одно или оба из этих решений, и если они есть, я хотел бы, чтобы некоторые указатели на A.polyfill, который исправляет нужные мне CSS-теги, или B. идея / способ сортировки и структурирования данных из pdf-парсера.