Непоследовательное распознавание текста в Google OCR - PullRequest
0 голосов
/ 29 октября 2018

Я использую Goggle vision 'documentTextDetection' для одного из моих проектов. Моя цель состоит в том, чтобы обнаружить текст из изображений, при проверке у меня создается впечатление, что я получаю несогласованное извлечение текста для одних и тех же изображений (т.е. разные ссылки, но изображение одинаковое) и получаю разные результаты.

Я использую '@ google-cloud / vision' (https://github.com/googleapis/nodejs-vision) узел npm для того же. Также заметил, что некоторые символы не совпадают в результатах

Например: в большинстве случаев «0» распознается как O (https://samsung -nudge.s3.eu-central-1.amazonaws.com / 4.jpeg ), 5 как S (https://samsung -nudge.s3.eu-central-1.amazonaws.com / 4.jpeg ), / as I (https://samsung -nudge.s3.eu-central-1 .amazonaws.com / 1.jpeg ) и т. д.

let imageurl= 'https://samsung-nudge.s3.eu-central-1.amazonaws.com/barcode1540752102759.jpeg'
client
.documentTextDetection(imageurl)
.then(results => {
       console.log('results', JSON.stringify(results[0].textAnnotations))
})
.catch(err => {
    console.error('GOOGLE VISION ERROR:', err);
    reject(err)
});

То же изображение дает разные результаты

https://samsung -nudge.s3.eu-central-1.amazonaws.com / barcode1540752102759.jpeg

МОДЕЛЬ: \ nRH60H8138WZ \ nPOWER: \ n230 В / 50 Гц \ nКомпрессор: \ n2007 - 000029 \ nМОДЕЛЬНЫЙ КОД: \ nRH6OH8138WZ / SS \ nСерийный номер: \ n07KH43AG300046M \ n

https://samsung -nudge.s3.eu-central-1.amazonaws.com / m.jpeg

МОДЕЛЬ: \ nRH60H8138WZ \ nPOWER: \ n230 В / 50 Гц \ nКомпрессор: \ n2007 - 000029 \ nМОДЕЛЬНЫЙ КОД: \ nRH60H8138WZ / SS \ nСерийный номер: \ n07KH43AG300046M \ n

Пожалуйста, дайте мне знать, почему я получаю противоречивые ответы? Также дайте мне знать, что я могу сделать, чтобы улучшить результаты.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...