Можно ли использовать RNN / LSTM для нестандартного текстового распознавания текста? - PullRequest
0 голосов
/ 17 декабря 2018

Я читал о LSTM и RNN, даже CTC.Из того, что я понимаю, RNN используется для обозначения недостающего токена в последовательности (например, слова в предложении).Однако, моя проблема - чтение имен людей, написанных курсивным шрифтом .Многие имена не популярны и не могут быть найдены в языковой модели, поэтому, если RNN предсказывает только пропущенное слово, это не удастся, так как у меня нет полного набора возможных имен людей, верно?

1) Могу ли я использовать RNN для распознавания нестандартных слов?(например, редкие / непопулярные имена людей)

2) Если нет, есть ли другой альтернативный вариант.?Или я должен использовать традиционный подход OCR (чтобы попытаться сегментировать, а затем классифицировать символы)?

1 Ответ

0 голосов
/ 17 декабря 2018

Нейронные сети, построенные из CNN + RNN + CTC, работают на на уровне символов .Они учатся предсказывать символьные строки и не заботятся о словах или базовом языке .Конечно, вы можете интегрировать словарь и / или языковую модель в CTC-декодер, но это не обязательно.Таким образом, такие сети могут читать произвольные имена людей , просто взглянув на символы.Для высокоуровневого введения в распознавание текста с такими моделями нейронных сетей см. https://towardsdatascience.com/2326a3487cd5

Только одно дополнительное примечание: RNNs используются для распространения информации по последовательности Например, чтобы выяснить, каким может быть неоднозначный персонаж в зависимости от его окружения.

...