Краткое введение :
Я пытаюсь получить определенные тексты из изображения большого количества текстов.
Просто подумав, должно быть по крайней мере два способа решения этой проблемы:
Один из способов - сначала сегментировать изображения по текстовым областям - например, обучить нейронную сеть с помощью набора образцов изображений, содержащих образцы текста, и затем позвольте обученной модели найти соответствующие текстовые области в реальном изображении, затем обрезать эту область из изображения, сохранить ее - и, во-вторых, использовать, например, pytesseract
для преобразования изображения в строку.
Другой способ - обратить процессы. Сначала преобразуйте изображение в строки, затем обучите нейронную сеть с образцами реальных текстов, затем позвольте обученной модели найти соответствующие тексты в текстах, преобразованных из изображений.
Итак, мои вопросы перечислены ниже :
Можно ли решить эту проблему без обучения нейронной сети? Будет ли она более эффективной, чем NN, с точки зрения время, необходимое для запуска программы и точность результатов ?
Среди двух методов, описанных выше I написал, какой из них лучше , с точки зрения времени, необходимого для запуска программы и точность результатов ?
- Любые другие опытные предложения?
Дополнительная справочная информация при необходимости :
Итак, У меня есть несколько групп скриншотов разных веб-страниц, в каждой из которых много текстов. И я хочу извлечь определенные абзацы из этого большого объема текстов. В параграфы, которые я хочу извлечь express похожие вещи, но в разных контекстах.
Например, на большой смешанной платформе онлайн-форума, многие комментарии делаются о разных вещах, некоторые о горных пейзажах, о политике, некоторые науки и т. д. c ... Так как эта платформа не может иметь только одну страницу, должно быть сотни страниц, на которых бесчисленные пользователи оставляют свои комментарии. Теперь я хочу извлечь комментарии по политике конкретно со всего форума, то есть со всех страниц этой платформы. Поэтому я бы использовал Python
+ Selenium
, чтобы очистить страницы и сохранить скриншоты. Теперь нам нужно go вернуться к вопросам, заданным выше. Что делать сейчас?
Обновление:
Просто мысль прошла. Вероятно, NN, обученный изображениями, которые содержат тексты, не может дать очень точное местоположение искомых текстов, поскольку NN может только искать расположения пикселей вместо слов или даже значения, которые составляют предложения или абзацы. Так, может быть, второй метод, обработка текста, может быть лучше в этом случае? (как NLP
?)