У меня следующая проблема:
Мне нужно извлечь таблицу предметов из чеков, как те, которые вы получаете в супермаркетах.Это не чистый счет А4, где в таблицах обычно есть строки.
Я получаю символы вместе с ограничивающими прямоугольниками из механизма OCR.Затем я выровняю его по оси X.Теперь мне нужно найти таблицы.
Я не хочу использовать для этого глубокое обучение, так как это будет очень большой проект, очень рискованный, очень сложный для отладки, и мне не хватаетданные (несколько сотен).Хо, и у меня недостаточно опыта в обучении RNNs ...
Я рассматриваю как алгоритм машинного обучения, так и мой собственный алгоритм.Я предполагаю, что ML лучше, но я не уверен, какой алгоритм даст массив результатов (= строки элементов или, по крайней мере, y-асикс каждой строки).
Кроме того, в чем заключается особенностьвектор для такой контролируемой ОД?у меня есть квитанции с 2 строками и квитанции с 10 строками.
Кстати, когда я говорю "линия", я имею в виду позицию.каждый элемент может быть записан в две строки.
Любой совет, как решить эту проблему?