Извлечение информации - PullRequest
       10

Извлечение информации

0 голосов
/ 08 октября 2019

Я ищу шаги / процесс для извлечения информации из Счета-фактуры, используя машинное обучение / НЛП / методы глубокого обучения. Какими будут шаги / процесс, которому нужно следовать?

Подход потребует пояснения ниже

Предположим, есть счета от 2 поставщиков, как нужно создать модель для извлечения упомянутой стоимостидля полей ниже? Будет ли это иметь извлечение ключевых слов? Должен ли быть реализован пользовательский NER, если да, то как? Как для этого должны быть созданы данные обучения?

Номер счета Дата счета Дата счета Адрес

1 Ответ

0 голосов
/ 10 октября 2019

Вы можете использовать SpaCy для обучения ваших пользовательских NER. Существует определенный формат ввода, который требуется SpaCy, который содержит начальный и конечный индексы каждого объекта и его метку. Вы можете обратиться к документации SpaCy: https://spacy.io/usage/training

...