Мой вопрос касается анализа / анализа документов с большим количеством технических данных, чем естественный контент, содержащий предложения на конкретном c языке. Моя цель - извлечь технические объекты из накладной или документа заказа. Такие документы не часто содержат полные предложения. Есть более необработанные текстовые данные, такие как:
Your OrderID 77773, tender no. 11111. Invoice Date 03/03/2020 Amount 399,00 EUR Payment in 14 days. IBAN xxxx-yyyyy-0000 BIC 333xxxxxx
Можно ли обучить процессор NLP для извлечения таких вещей, как IBAN или ORDER-NO из такого рода текста? Или НЛП является совершенно неправильным подходом для такого рода данных?