PHP pdf 2 текстовая проблема - PullRequest
1 голос
/ 31 марта 2011

Я использую библиотеку Zend_Pdf для извлечения текста из PDF, и у меня есть некоторые проблемы ...

<?php
set_include_path (__DIR__ . '\data'); 
require_once 'Zend/Pdf.php'; 

 // Load PDF document from a file. 
$fileName = 'carbsarticle.pdf'; 
$pdf = new Zend_Pdf($fileName); 
$pdf = Zend_Pdf::parse($pdf); 
var_dump($pdf);

Неустранимая ошибка: необработанное исключение 'Zend_Pdf_Exception' с сообщением 'Файл не является PDF.'

Я пытался скачать другой файл PDF, но ошибка та же ..

EDIT:

try {
    $pdf2 = Zend_Pdf::load('test.pdf');
} catch (Exception $e)
{
    echo $e->getMessage();
}

Это повторяет: модификация зашифрованного документа не поддерживается

Мой pdf: http://x3k.ru/test.pdf

Ответы [ 4 ]

2 голосов
/ 31 марта 2011

Хорошо, только что видел использование в документации Zend

#
// Load a PDF document from a file
#
$pdf2 = Zend_Pdf::load($fileName);
#

#
// Load a PDF document from a string
#
$pdf3 = Zend_Pdf::parse($pdfString);
#
...

Это способ загрузки файла PDF.

0 голосов
/ 16 апреля 2011

У меня недавно была такая проблема с файлом в формате PDF, который я получил от кого-то.Мне пришлось полностью снять защиту паролем, чтобы Zend работал с ним вообще.Zend не будет изменять любые зашифрованные документы.Я закончил тем, что получил расшифровщик PDF, чтобы сделать работу, есть много, если вы потеряли оригинальный пароль.

0 голосов
/ 01 апреля 2011

Файл PDF защищен от копирования, я думаю :) Используйте другой файл - скажем, скачать что-то из Интернета.

0 голосов
/ 31 марта 2011

Проверьте ваш путь к каталогу. Может быть, вам нужно установить как set_include_path (__DIR__ . '\data\');

...