Я довольно неосведомлен о том, что появляется в html / javascript веб-сайте, потому что я трачу большую часть своего времени на серверную часть (формулировка!).По сути, я хочу знать, как лучше получить URL-адрес компании, например, PETA , и из этого URL-адреса найти описательные слова о компании из HTML-кода на первой странице.Таким образом, вы можете быстро запустить веб-сайт категоризации с автоматической пометкой, указав только список URL-адресов компаний.
Если это разумно, любые рекомендации по инструментам / процессам для поиска / извлечения контента будут приветствоваться.1005 *
А если нет или у вас есть лучшая идея, чтобы получить теги, пусть это также будет известно!