Я пытаюсь создать блог-картографический сайт, который бы определял текущие тенденции в данном наборе блогов. Для удобства я собираюсь сосредоточиться на данном списке блогов Wordpress.
Есть ли пакет Python для разбора Wordpress HTML?
Я ищу:
- Идентификация (Является ли данный HTML блогом Wordpress)
- Свойства блога (имя, сообщения, ссылка на RSS, блогролл ...)
- Свойства сообщения (заголовок, текст, теги ...)
Если такого пакета нет, я могу реализовать его как проект с открытым исходным кодом, но существующий сэкономит мне много времени.