Кто-нибудь с опытом работы с форматом XML для Nuance OmniPage SDK? - PullRequest
1 голос
/ 29 июля 2011

Я использую Nuance OmniPage SDK для выполнения распознавания изображений и PDF-файлов. В одном из моих случаев мне приходится анализировать XML-файл, который генерирует распознавание при распознавании файла, но цифры на самом деле не имеют смысла. Вот пример вывода для SDK:

<page ocr-vers="OmniPageCSDK16" app-vers="OfficeDrop">
    <description backColor="ffffff">
        <source
            file="C:\Users\workspace\jobs\src\test\resources\test-docs\0003.tiff"
            dpix="300" dpiy="300" sizex="2480" sizey="3509" />
        <theoreticalPage size="Custom" marginLeft="0"
            marginTop="0" marginRight="0" marginBottom="0" width="2480" height="3509" />
    </description>
    <zones>
        <textZone l="1814" t="1517" r="4694" b="1733" fillingMethod="omnifont"
            recognitionModule="omnifontPlus2w" chrFilter="all">
            <ln l="1814" t="1517" r="4690" b="1728" baseLine="1680"
                underlined="none" fontSize="1100">
                <wd l="1814" t="1517" r="2539" b="1728">Sample</wd>
                <space width="67" />
                <wd l="2606" t="1541" r="2995" b="1680">text</wd>
                <space width="72" />
                <wd l="3067" t="1570" r="3302" b="1680">on</wd>
                <space width="72" />
                <wd l="3374" t="1517" r="3734" b="1680">line</wd>
                <space width="91" />
                <wd l="3826" t="1522" r="3912" b="1680">1</wd>
                <space width="82" />
                <wd l="3994" t="1570" r="4459" b="1728">page</wd>
                <space width="91" />
                <wd l="4550" t="1522" r="4690" b="1680">1.</wd>
                <space />
            </ln>
        </textZone>
    </zones>
</page>

Определение размера страницы довольно легко определить ((2480 * 72) / 300) даст мне правильную ширину страницы в точках (а затем и высоту) для конечной страницы PDF, но другие значения не имеет никакого смысла.

Что это за размер шрифта 1100? И эти слова координаты? Как они могут иметь координаты, которые находятся в позициях, которые не существуют на странице?

Есть ли кто-нибудь, кто знает, что это за формат XML или может указать мне на документацию? Я искал все руководства, которые поставлялись с SDK, и я до сих пор не могу найти ничего, связанного с тем, что представляют эти значения или какую единицу они используют (я уверен, что это не пиксели или точки, я думаю).

Любая помощь приветствуется. Я использую Java-привязки для доступа к OmniPage C SDK.

1 Ответ

3 голосов
/ 01 декабря 2011

Координаты слова Omni Page обычно выводятся в виде твипов, которые необходимо выполнить для преобразования точки или пикселя.например, если я хочу рассчитать измерение для изображения с разрешением 200 точек на дюйм, мне нужно сделать это следующим образом (значение * 200) / 1440 пикселей. Для перекрестной проверки просто откройте изображение в кисти и посмотрите положение указателя для каждого слова.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...