itext - PDF в HTML - PullRequest
       35

itext - PDF в HTML

1 голос
/ 15 мая 2010

Я потратил около 20 часов на кодирование для создания счетов с использованием iText в c # Теперь я хочу использовать тот же код для преобразования некоторых таблиц в html.

Вы знаете, могу ли я это сделать?

Например, у меня есть это:

PdfPTable table = new PdfPTable(3);
table.DefaultCell.Border = 0;
table.DefaultCell.Padding = 3;
table.WidthPercentage = 100;
int[] widths = { 100, 200, 100};
table.SetWidths(widths);

List listOfCompanyData = (List)getCompanyData();
List listOfCumparatorDreaptaData = (List)getCumparatorDreaptaData(proformaInvoice.getCumparatorDreapta());

table.AddCell((Phrase)listOfCompanyData.Items[0]);
table.AddCell("");
table.AddCell((Phrase)listOfCumparatorDreaptaData.Items[0]);

и я хочу преобразовать эту таблицу в html ...

Возможно ли это?

Ответы [ 4 ]

1 голос
/ 20 октября 2010

PDF - это формат только для записи. Каждый раз, когда ваш рабочий процесс требует «извлечь данные из PDF», вы, вероятно, облажались.

Сказав это, есть несколько способов сохранить данные в PDF:

  • Поля формы не имеют определенного предела длины и не должны быть видимы. Получение данных формы с помощью iText тривиально.
  • Вы можете прикрепить файл к PDF и выгрузить его позже, как с iText.
  • Поля DocInfo. Вы можете вставить строку в одно из полей метаданных author / title / keyword / etc. Уродливый хак, но эффективный.
  • метаданные XML. «Новые» метаданные хранятся в XML-схеме. Вы можете поместить туда практически все, что захотите ... хотя iText регенерирует некоторые из них каждый раз, когда вносит изменения (дата модификации и т. Д.)
  • Пользовательские ключи / значения. Вы можете добавить любые старые пары ключ / значение в любой старый словарь в PDF. Adobe хотела бы, чтобы вы зарегистрировали специфический для компании префикс для своих пользовательских тегов, чтобы избежать коллизий, но я никогда не чувствовал необходимости.
1 голос
/ 15 мая 2010

PDF и HTML - это принципиально разные технологии отображения. PDF намного сложнее, чем HTML, поэтому вы найдете так много конвертеров HTML в PDF. Обратный путь намного сложнее.

iText может делать это только из HTML в PDF.

Есть онлайн конвертеров , которые будут принимать PDF и конвертировать его в HTML. Есть также загружаемые утилиты.

Я не знаю ни одной библиотеки .NET, которая будет делать это.

0 голосов
/ 16 мая 2010

nFOP + XSLT + XML = pdf | док | HTML

nfop.sourceforge.net / article.html должен дать вам представление о том, как его использовать, вам нужен «Распространяемый пакет Microsoft Visual J # NET» для запуска nFOP

с открытым исходным кодом без затрат:)

K

0 голосов
/ 15 мая 2010

Из книги iText in Action кажется, что это выполнимо с использованием исходной библиотеки java, но, похоже, она больше не переносится в c # lib. Я почти уверен, что это было в версии 4: - /

Попробуйте взглянуть на какой-нибудь старый источник здесь: http://www.koders.com/csharp/fid60B0985D3A89152128B73F54EDD4EB5420A5E4D8.aspx?s=%22Ken+Auer%22

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...