К сожалению, из-за конфиденциальных данных я не могу дать более конкретного объяснения.
Проблема
Итак, у меня есть несколько документов, которые вОбычно содержат одну и ту же информацию, но имеют разные форматы.В большинстве случаев искомое значение находится рядом с ключевым словом в документе.О самом OCR заботится API Google Cloud Vision, но как лучше всего обрабатывать различные форматы?
Моя идея
... заключалась в обучении классификатора, который обнаруживает, чтоФормат, с которым я имею дело, а затем выбирает подходящий способ нахождения целевого значения, который я реализовал заранее вручную.Это не удобно и не масштабируемо.Поэтому я ищу какой-то алгоритм, который я скажу, например, где находится целевое значение, как оно выглядит и т. Д.
Каков наилучший подход к решению проблемы ML или каковы ваши идеи?
В качестве примера типа данных: Допустим, у меня есть чеки из 20 различных супермаркетов, и я ищу, чтобы найти общую стоимость, с проблемой, что квитанция каждой компании выглядит по-разному.