Как работает Google Книги? Есть ли альтернативы с открытым исходным кодом? - PullRequest
0 голосов
/ 06 октября 2009

Меня попросили опубликовать полную книгу в Интернете, как это делает Google Книги? то есть он доступен для просмотра и печати, но недоступен для загрузки.

Является ли процесс в основном "высококачественным сканированием"? Есть ли какие-либо решения с открытым исходным кодом для «массового производства» «водяных знаков» на этих изображениях высокого качества. Предположим, у вас есть оригинальное изображение. и когда пользователь просматривает его в Интернете, я воссоздаю изображение, добавляя водяной знак и какой-то другой текст поверх изображения «на лету», если такая библиотека существует в Python вне курса:)

Есть советы? Если вы сделали это раньше, пожалуйста, поделитесь.

Спасибо

Ответы [ 3 ]

4 голосов
/ 06 октября 2009

К сожалению, Google использует запатентованную технику для сканирования своих книг, поэтому вам, вероятно, придется придерживаться традиционных методов.

Google создал некоторые изящные технология инфракрасной камеры, которая обнаруживает трехмерную форму и угол страниц книги, когда книга помещается в сканер. это информация передается в OCR программное обеспечение, которое подстраивается под искажения и позволяет OCR программное обеспечение для более точного чтения текста. Нет больше сломанных привязок, не более неэффективные стеклянные пластины.

В основном вам нужно будет отсканировать книгу с помощью приложения OCR (тессеракт хорош), затем я сгенерирую PDF / изображение из отсканированного текста и, наконец, добавлю водяной знак сверху. Python Imaging Library может показаться лучшим инструментом для этого.

1 голос
/ 06 октября 2009

Не знаю много о Google Книгах, но Библиотека изображений Python может делать водяные знаки (для этого есть рецепт ASPN ).

0 голосов
/ 06 октября 2009

См. Вопрос slashdot о воспроизведении технологии фото + лазерной сетки Google.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...