Является ли Nlp наряду с обработкой изображений лучшим способом извлечения данных с сайтов электронной коммерции? - PullRequest
0 голосов
/ 15 октября 2019

У меня есть опыт машинного обучения и глубокого обучения на уровне колледжа, и в настоящее время я работаю в софтверной компании. Моя проблема заключается в извлечении данных со страниц отображения продукта определенного сайта электронной коммерции с ограничением на то, что каким бы ни было решение, оно должно быть адаптировано к возможным периодическим изменениям на странице отображения продукта сайта. Предлагаемая идея состоит в том, чтобы использовать сеть глубокого обучения, в которой сеть обучается с использованием набора данных (HTML-скрипт страницы, сопоставленной с необходимыми данными) с использованием некоторых методов НЛП. Кроме того, я подумал, что мог бы использовать изображение, представленное этим HTML-кодом, для подачи в сеть OCR для извлечения данных. Это невыполнимая задача? Открыты для любых других решений, которые могут адаптироваться к изменениям на веб-странице. И спасибо заранее. тип данных, которые мне нужно извлечь, упоминается, это изображение

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...