Как извлечь реферат из PDF, используя PHP? - PullRequest
0 голосов
/ 08 апреля 2020

Я использую pdfparser.org для анализа pdf. Мне нужно извлечь PDF. Мне нужны следующие детали из PDF. Название, автор, ключевые слова, аннотация, ссылка (необязательно)

В pdfparser.org мы можем извлечь только метаданные. В противном случае Полный текст. Но как получить реферат. Я приложил образец PDF ссылку ниже. (http://www.hindex.org/2013/1V1I115.pdf) Также, пожалуйста, предложите различные источники в PHP. Прилагается мой код.

<?php

// Include 'Composer' autoloader.
include 'vendor/autoload.php';

// Your code
// ...
$parser = new \Smalot\PdfParser\Parser();
$title='';$Keywords='';$Author='';
?>
<!DOCTYPE html>
<html lang="en">
<head>
  <title></title>
  <meta charset="utf-8">
  <meta name="viewport" content="width=device-width, initial-scale=1">
  <link rel="stylesheet" href="https://maxcdn.bootstrapcdn.com/bootstrap/4.4.1/css/bootstrap.min.css">
  <script src="https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js"></script>
  <script src="https://cdnjs.cloudflare.com/ajax/libs/popper.js/1.16.0/umd/popper.min.js"></script>
  <script src="https://maxcdn.bootstrapcdn.com/bootstrap/4.4.1/js/bootstrap.min.js"></script>
</head>
<body>
  <form method="post">
<div class="container">
  <div class="row">
    <div class="col-md-4">
      <h3>Pdf URL</h3>
      <input type="text" class="form-control" name="url" />      
    </div>
    <div class="col-md-4">
      <input type="submit" class="btn btn-primary" value="Get Details" name="submit"/>
    </div>
  </div>
</div>
</form>
<?php
if(isset($_POST['submit'])){
  $url=$_POST['url'];
  $pdf    = $parser->parseFile($url);

// Retrieve all details from the pdf file.
$details  = $pdf->getDetails();

// Loop over each property to extract values (string or array).
foreach ($details as $property => $value) {
    if (is_array($value)) {
        $value = implode(', ', $value);
    }
    echo $property . ' => ' . $value . "\n";
    if ($property == 'Title'){ $title = $value; }
    if ($property == 'Keywords'){ $Keywords = $value; }
    if ($property == 'Author'){ $Author = $value; }
}
}
?>
<div class="container">
<h3><?php echo $title; ?></h1>
    <div class="row">
      <div class="col-md-6"><span>Title</span></div>
      <div class="col-md-6"><?php echo $title; ?></div>
    </div>
    <div class="row">
      <div class="col-md-6"><span>Keywords</span></div>
      <div class="col-md-6"><?php echo $Keywords; ?></div>
    </div>
    <div class="row">
      <div class="col-md-6"><span>Author</span></div>
      <div class="col-md-6"><?php echo $Author; ?></div>
    </div>
</div>
</body>
</html>
...