Я использую pdfparser.org для анализа pdf. Мне нужно извлечь PDF. Мне нужны следующие детали из PDF. Название, автор, ключевые слова, аннотация, ссылка (необязательно)
В pdfparser.org мы можем извлечь только метаданные. В противном случае Полный текст. Но как получить реферат. Я приложил образец PDF ссылку ниже. (http://www.hindex.org/2013/1V1I115.pdf) Также, пожалуйста, предложите различные источники в PHP. Прилагается мой код.
<?php
// Include 'Composer' autoloader.
include 'vendor/autoload.php';
// Your code
// ...
$parser = new \Smalot\PdfParser\Parser();
$title='';$Keywords='';$Author='';
?>
<!DOCTYPE html>
<html lang="en">
<head>
<title></title>
<meta charset="utf-8">
<meta name="viewport" content="width=device-width, initial-scale=1">
<link rel="stylesheet" href="https://maxcdn.bootstrapcdn.com/bootstrap/4.4.1/css/bootstrap.min.css">
<script src="https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js"></script>
<script src="https://cdnjs.cloudflare.com/ajax/libs/popper.js/1.16.0/umd/popper.min.js"></script>
<script src="https://maxcdn.bootstrapcdn.com/bootstrap/4.4.1/js/bootstrap.min.js"></script>
</head>
<body>
<form method="post">
<div class="container">
<div class="row">
<div class="col-md-4">
<h3>Pdf URL</h3>
<input type="text" class="form-control" name="url" />
</div>
<div class="col-md-4">
<input type="submit" class="btn btn-primary" value="Get Details" name="submit"/>
</div>
</div>
</div>
</form>
<?php
if(isset($_POST['submit'])){
$url=$_POST['url'];
$pdf = $parser->parseFile($url);
// Retrieve all details from the pdf file.
$details = $pdf->getDetails();
// Loop over each property to extract values (string or array).
foreach ($details as $property => $value) {
if (is_array($value)) {
$value = implode(', ', $value);
}
echo $property . ' => ' . $value . "\n";
if ($property == 'Title'){ $title = $value; }
if ($property == 'Keywords'){ $Keywords = $value; }
if ($property == 'Author'){ $Author = $value; }
}
}
?>
<div class="container">
<h3><?php echo $title; ?></h1>
<div class="row">
<div class="col-md-6"><span>Title</span></div>
<div class="col-md-6"><?php echo $title; ?></div>
</div>
<div class="row">
<div class="col-md-6"><span>Keywords</span></div>
<div class="col-md-6"><?php echo $Keywords; ?></div>
</div>
<div class="row">
<div class="col-md-6"><span>Author</span></div>
<div class="col-md-6"><?php echo $Author; ?></div>
</div>
</div>
</body>
</html>