Извлекайте текст из PDF и сохраняйте его в базе данных, сохраняя интервалы - PullRequest
0 голосов
/ 02 сентября 2010

У меня есть PDF-документ, содержащий только текст, который нужно сохранить в столбце varchar в MSSQL.Первый улов заключается в том, что необходимо сохранить интервал текста в PDF-файле, чего нельзя сделать, просто вставив копию из PDF-файла в SSMS.

Хорошо, поэтому мне нужно приложениечитать PDF как текст, сохраняя интервалы.Но теперь приходит второй улов: PDF отображается шрифтом Helvetica, но текст, сохраненный в БД, будет отображаться в Arial на Crystal Report (Crystal 8 ... bleh), и при отображении он должен выглядеть следующим образомPDF (т. е. такое же выравнивание), насколько это возможно.

Предлагаемое мной решение - преобразовать PDF в векторное изображение, сохранить полученный поток байтов в БД и протянуть байты черезчерез кристалл.К сожалению, из-за нехватки времени это не может быть реализовано сейчас, поэтому мне нужно быстрое и грязное решение.

По сути, как только я получил версию Helvetica из PDF, я должен обойти все вокругс интервалом, чтобы преобразовать его, чтобы выглядеть правильно в Arial.Мне нужен инструмент, который может сделать это для меня, так как у меня нет времени, чтобы написать один - какие-либо предложения?

Ответы [ 2 ]

0 голосов
/ 03 сентября 2010

Боюсь, что это проблема обучения пользователей: вывод шрифта Arial отличается от вывода шрифтом Helvetica. Это необходимо объяснить пользователям.

Ссылка на Ратергейта - http://en.wikipedia.org/wiki/Rathergate - может помочь убедить их; по сути, карьера Дэна Ратера закончилась, потому что он не понимал значения межстрочного интервала в разных шрифтах. (/ Упрощением)

Альтернативой может быть использование редактора шрифтов, сохранение версии шрифта Arial со свойствами пробелов Helvetica, а затем использование этого нового шрифта в вашем отчете - это действительно клудж, оно будет выглядеть ужасно и может нарушить авторские права на шрифт (предположительно принадлежащие Microsoft). Я действительно не рекомендовал бы это.

0 голосов
/ 02 сентября 2010

Ваша версия Crystal обрабатывает динамические местоположения изображения?Если это так, вы можете сохранить изображение в формате PDF (я уверен, что где-то есть утилита для этого), и в вашем Crystal Report создайте объект изображения с расположением изображения, установленным на любой PDF-файл, который вы хотите.

...