Можно ли использовать stanford-nlp / CoreNLP для разбора технической документации? - PullRequest
0 голосов
/ 31 марта 2020

Мой вопрос касается анализа / анализа документов с большим количеством технических данных, чем естественный контент, содержащий предложения на конкретном c языке. Моя цель - извлечь технические объекты из накладной или документа заказа. Такие документы не часто содержат полные предложения. Есть более необработанные текстовые данные, такие как:

Your OrderID 77773, tender no. 11111. Invoice Date 03/03/2020 Amount  399,00 EUR Payment in 14 days. IBAN xxxx-yyyyy-0000  BIC 333xxxxxx

Можно ли обучить процессор NLP для извлечения таких вещей, как IBAN или ORDER-NO из такого рода текста? Или НЛП является совершенно неправильным подходом для такого рода данных?

...