У меня есть несколько изображений, которые содержат медицинскую информацию. Например, Patient Name
, Doctor Name
, Date of Birth
, Total billing amount
. Вся эта информация находится в почти фиксированной части изображения и очень мало зависит от того, как оно сканируется (изображение находится либо посередине, либо справа, либо немного наклонено).
Можем ли мы использовать решение для глубокого обучения / нейронной сети, в котором можно определить, что в определенном месте есть только имя пациента или имя доктора? Как только мы определим местоположение этих частей, мы можем использовать механизм OCR для извлечения текста.
У меня есть решение, в котором я использовал OCR + некоторое регулярное выражение для определения правильного текста.
В качестве ожидаемого результата мне нужно получить имя пациента, дату рождения от него.