Это упрощенный подход, который сканирует все закладки, чтобы найти соответствующий объект, а затем сканирует каждую страницу, пока он не совпадает с одним и тем же объектом.Возможно, не самый элегантный подход, но должен выполнить свою работу.
from PyPDF2 import PdfFileReader
reader = PdfFileReader('D:\\Downloads\Sample.pdf')
# Scan outlines for bookmark containing KYC
outlines = reader.outlines
print(outlines)
for bookmark in outlines:
print(bookmark['/Title'])
print(bookmark['/Page'])
if bookmark['/Title'] == 'KYC':
mypage = bookmark['/Page']
# Scan page looking for the matching object
print(reader.getNumPages())
for x in range(0, reader.getNumPages()):
apage = reader.getPage(x)
print(apage)
if apage == mypage:
print('Eureka on page', x + 1)