Как читать разные языковые шрифты в pdf с помощью nodejs - PullRequest
0 голосов
/ 19 октября 2018

Я использую nodejs в качестве сервера в моем приложении.Я использовал модули pdfreader и pdfjson npm для чтения файла pdf.

мой код показан ниже:

let fs = require('fs'),
PDFParser = require("pdf2json");
let pdfParser = new PDFParser();

pdfParser.on("pdfParser_dataError", errData => console.error(errData.parserError) );
pdfParser.on("pdfParser_dataReady", pdfData => {
    fs.writeFile("./pdf2json/test/F1040EZ.json", JSON.stringify(pdfData));
});

pdfParser.loadPDF("./sample.pdf");

Я правильно прочитал файл.Теперь я был поражен файлами, которые содержат разные языковые файлы.Мои файлы могут содержать японский и индийский языки, такие как хинди, тамильский и телугу.

Я не получаю другой язык после анализа.Как я могу прочитать на другом языке и записать в другой файл?

...