Я пробовал использовать библиотеки pdf2 json, pdf-extract, но получаю только имя шрифта. Как я могу извлечь цвет шрифта, размер шрифта и другие свойства, связанные с PDF?
Я получаю данные в этом формате при использовании pdf extract
{
x: 97.21423186799998,
y: 1073.0790345419,
str: 'a',
dir: 'ltr',
width: 9.001199999999999,
height: 9.01061,
fontName: 'g_d0_f3'
}
при использовании pdf2 json Я получаю эти данные
{
"formImage": {
"Transcoder": "pdf2json@1.1.8 [https://github.com/modesty/pdf2json]",
"Agency": "",
"Id": {
"AgencyId": "unknown",
"Name": "unknown",
"MC": false,
"Max": -1,
"Parent": -1
},
"Pages": [
{
"Height": 167.875,
"HLines": [],
"VLines": [],
"Fills": [{ "x": 0, "y": 0, "w": 0, "h": 0, "clr": 1 }],
"Texts": [],
"Fields": [],
"Boxsets": []
}
],
"Width": 32.5
}
}