Я использую функцию getTextContent()
для извлечения текста страницы PDF с использованием пакета pdf.js и возвращает следующие элементы.
{ str:
'Si desea modificar o corregir sus datos personales, puede acudir a cualquier',
dir: 'ltr',
width: 307.3639090879885,
height: 8.040038228246251,
transform:
[ 8.040038228246251,
0,
0,
8.040038228246251,
30.358212111551254,
175.43839784367367 ],
fontName: 'g_d0_f1' },
{ str: 'de la',
dir: 'ltr',
width: 19.747558740156638,
height: 8.040038228246251,
transform:
[ 8.040038228246251,
0,
0,
8.040038228246251,
520.6837612500001,
175.43839784367367 ],
fontName: 'g_d0_f1' },
Я предполагаю (яне нашел никаких документов API), что преобразование перечисляет информацию о координатах текстового блока в фактическом окне просмотра страницы PDF.
AFAIK этот пакет может преобразовывать весь PDF в изображения PNG, поэтому ямне интересно, могу ли я просто взять часть документа, с которой я хочу создать изображение.