Я хочу идентифицировать элемент div , который имеет главное меню на веб-сайте.
Подход, о котором я думаю:
- Разбор HTML с использованием Beautiful Soup
- Обычно меню имеют самую высокую плотность ссылок, т.е. количество тегов привязки, или ищут ul со всеми тегами li, имеющими ссылки
Приведенный выше подход может дать сбойпотому что на разных веб-сайтах элемент нижнего колонтитула может иметь высокую плотность ссылок (например: www.langoor.com )
Другой подход состоит в поиске ключевого слова "menu "in" id "или" class "атрибуты элементов div.Это очень дорогой подход, так как мы могли бы в конечном итоге искать много слов.
Было бы здорово, если бы вы помогли мне посмотреть в правильном направлении, чтобы решить эту проблему.Спасибо!