Как классифицировать определенные c типы мемов? - PullRequest
0 голосов
/ 27 апреля 2020

В настоящее время я работаю над проектом, включающим мемы, в котором я использую openCV и pytesseract, чтобы отделить мемы от его текстовой части и части изображения и запустить OCR для текста. На данный момент мой код хорошо работает с такими мемами: Full meme, где мем состоит из двух частей, верхняя часть - заголовок мема с белым фоном, а нижняя часть - изображение мема. .

Однако, поскольку я собирал мемы из разных источников (например, Reddit, Instagram, et c.), У меня появилось много мемов, которые не соответствуют этому формату. Это проблематично c для меня, так как обрезка и OCR, которые у меня есть сейчас, вообще не работают с мемами в другом формате, что делает вывод бесполезным.

Мне было интересно, как мне следует go собирается настроить механизм предварительной обработки, чтобы идентифицировать / классифицировать эти определенные c типы мемов. Я очень увлекаюсь технологиями, связанными с компьютерным зрением, но я хочу учиться, так что если кто-нибудь может указать мне правильное направление, это было бы здорово! Спасибо!

...