Как Google реализует онлайн-ридер PDF? - PullRequest
1 голос
/ 26 февраля 2010

Я немного не осведомлен о современных веб-технологиях, последние играли с ними еще во времена CGI. Мне любопытно, как Google реализует свою программу чтения PDF в Интернете, не могли бы вы объяснить это вкратце? из того, что я могу сказать, это не простая веб-страница / изображение

Спасибо

Ответы [ 3 ]

1 голос
/ 26 февраля 2010

Это всего лишь предположение, так как я не работаю на Google. У них будет скрипт, процесс, который будет читать документ PDF, читать каждую страницу и конвертировать страницу в изображения, а затем они будут иметь некоторый элемент управления javascript, который фиксирует местоположение мыши для выделения текста. Может быть использовать OCR для распознавания текста или просто взять его из документа.

1 голос
/ 26 февраля 2010

Похоже, что JavaScript с документом, изображенным в виде изображения.

Скорее всего, процесс на стороне сервера преобразует документ в изображение, а средство просмотра на стороне клиента отображает изображение таким образом, чтобы оно выглядело как документ.

0 голосов
/ 05 июля 2014

Я тоже думал, что это изображение, которое они представляют. Более тщательная проверка полученных результатов показывает, что они фактически анализируют документ pdf в HTML и отображают HTML на экране.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...