Я думаю, вам может понадобиться определить некоторые разделы, которые вы хотите извлечь.Например, ссылочный идентификатор, вам нужно определить, как вы будете его называть.Поскольку некоторые магазины называют его «ссылочным идентификатором», некоторые называют его «ссылочным кодом», а некоторые называют его «ref ID».Вы можете использовать именованное распознавание сущностей для захвата этих словЗатем обучите модель классификации, чтобы сопоставить все эти разные имена с определенным вами именем.Это на самом деле текстовая классификация.Затем вы также можете обучить модель распознавания именованных сущностей для захвата фактического кода, прикрепленного к имени раздела.