Я работаю над распознаванием почерка и связанными с ним вещами на платформе visual studio и использую библиотеки openCV. Ввод осуществляется в виде отсканированных двоичных файлов .tif.
В настоящее время я вошел в контрольно-пропускной пункт, пытаясь найти способ распознавания вычеркнутых слов, когда вы вычеркиваете (отменяете) слова, используя прямую / изогнутую линию. Я не собираюсь заниматься индивидуальным распознаванием символов, потому что это будет пустой тратой вычислительных ресурсов.
Есть ли способ распознать такие случаи по-другому?
Ниже приведены две идеи, с которыми я столкнулся, но я не уверен -
1> используйте маску вроде <0 0 0, 1 1 1, 0 0 0>, которая поможет найти все горизонтальные линии ... но это будет очень большое предположение. линии могут быть волнистыми и в любой ориентации.
2> скелетонизировать вход и искать пересечения. это даст мне довольно много пересечений - включая те, которые происходят из-за линии, используемой, чтобы вычеркнуть слово. используя некоторые приближения, такие как наименьшие квадраты и т. д. я могу получить приблизительную линию. но есть проблема в том, что пересечения могут происходить во многих местах - например. 2 пересечения в 'b' и т. Д.
есть предложения?