Моя задача - извлекать информацию с различных веб-страниц определенного сайта.Теперь извлекаемая информация может иметь вид названия продукта, идентификатора продукта, цены и т. Д. Информация предоставляется в текстовом виде на естественном языке.Кроме того, меня попросили извлечь эту информацию, используя некоторый алгоритм машинного обучения.Я подумал об использовании NER (распознавания именованных объектов) и обучении его на пользовательских данных обучения (которые я могу подготовить, используя очищенные данные и вручную помечая целые числа / данные по мере необходимости).Я хотел знать, может ли модель работать таким образом?
Кроме того, дайте мне знать, если я смогу улучшить этот вопрос.