получение данных из pdf файла с использованием ElasticSearch / Symfony - PullRequest
0 голосов
/ 07 февраля 2019

На самом деле я использую Symfony, и я интегрировал ElasticSearch, я хочу извлечь данные из файла PDF (имя, возраст, адрес) / или текстового файла, чтобы получить форму, заполненную данными, как это сделать?
Ps: я настроил упругость.yml, я добавил все индексы, и когда я посетил 127.0.0.1:9200, я успешно получил свой объект (в формате json), все, что я хочу, это как читать из файла PDF и получать все данные

1 Ответ

0 голосов
/ 08 февраля 2019

Вы должны использовать библиотеку pdf для разбора, например https://pdfparser.org/documentation

$parser = new \Smalot\PdfParser\Parser();
$pdf    = $parser->parseFile('document.pdf');

$text = $pdf->getText();
echo $text;
...