Python: что такое метод gdata для загрузки изображения с включенным OCR? - PullRequest
1 голос
/ 05 июля 2010

, как показано в этом коде PHP, (http://code.google.com/p/gdata-samples/source/browse/trunk/doclist/OCRDemo/ocr.php?r=194)

где изображение может быть загружено в документы Google, которые автоматически преобразуются в текст. Мне интересно, как это сделать в Python. есть метод «загрузки», но я просто озадачен, как включить функцию OCR.

1 Ответ

2 голосов
/ 02 февраля 2011

при условии, что вы начали здесь: http://code.google.com/apis/documents/docs/3.0/developers_guide_python.html

у вас есть аутентифицированный client объект, уже созданный.

f = open('/path/to/your/test.pdf')
ms = gdata.data.MediaSource(file_handle=f, content_type='application/pdf', content_length=os.path.getsize(f.name))
folder = "https://docs.google.com/feeds/default/private/full" # folder in google docs.
entry = client.Upload(ms, f.name, folder_or_uri= folder + '?ocr=true') # ?ocr=true is the kicker

с указанием folder_or_uri с конечным параметром ?ocr=true isчто вызывает преобразование.

после того, как вы его создадите, теперь вы можете экспортировать его как текстовый документ.

...