Solr Tika, текст со стилем - PullRequest
       3

Solr Tika, текст со стилем

0 голосов
/ 14 декабря 2010

Я видел эту ссылку: http://www.lucidimagination.com/Community/Hear-from-the-Experts/Articles/Content-Extraction-Tika То, что я получил, это чистый текст без какого-либо стиля от Солки для поиска.Возможно ли иметь текст со своим стилем от Solr?Другими словами, нам нужно показать текст в оригинальном стиле после поиска по запросу.

1 Ответ

0 голосов
/ 14 декабря 2010

Если подумать, что такое «оригинальный стиль» в pdf? Какие составляющие «стиля» вы хотите сохранить?

Это не только шрифт и вес, это обводка, заливка, угол, траектория, графика, отслеживание, прозрачность, преобразования и многое другое. Если бы вы все это получили, как бы вы отобразили это в своем пользовательском интерфейсе / Интернете?

Вы не можете по-настоящему копировать оригинальный стиль, кроме отображения оригинального PDF. Так люди обычно делают это, если им нужно оригинальное форматирование.

В противном случае они просто используют чистый текст.

...