PDF-файлы с вложенными XML-файлами - PullRequest
0 голосов
/ 23 апреля 2010

HI All,

У меня есть файл PDF с приложенным xml, мне нужно разобрать файл xml. Кто-нибудь знает, как мне это сделать? Я использую C #.

Заранее спасибо.

Ответы [ 3 ]

0 голосов
/ 24 апреля 2010

PDF-файлы могут иметь объект метаданных или это XML-файл, встроенный как объект?

0 голосов
/ 28 апреля 2010

Я считаю, это сообщение в блоге , описывающее, как вам нужно читать из PDF-файла с использованием C #.

Вот пример, который он привел для извлечения текста из PDF:

using System;
using org.pdfbox.pdmodel;
using org.pdfbox.util;

namespace PDFReader
{
class Program
{
    static void Main(string[] args)
    {
        PDDocument doc = PDDocument.load("lopreacamasa.pdf");
        PDFTextStripper pdfStripper = new PDFTextStripper();
        Console.Write(pdfStripper.getText(doc));
    }
}
}

Здесь - это то, что выглядит как исчерпывающий и высокоорганизованный список того, как читать PDF с помощью C #.

Если вам нужна какая-то форма встроенных метаданных, как предложил Марк, я уверен, что с помощью инструментов, с которыми я связан, можно также получить данные.

0 голосов
/ 23 апреля 2010

Попробуйте использовать LINQ to XML , как предложено в этом вопросе.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...