Иногда я сталкиваюсь с html со странными атрибутами, как, например, fb: share: layout .
<a class="addthis_button_facebook_share" fb:share:layout="button_count" style="height:20px;"></a>
Я не совсем уверен, как они называются (itemscope? Пространства имен?).
В настоящее время я анализирую HTML с Beautifulsoup4 в Python.Мне интересно, есть ли способ удалить или переименовать все атрибуты, которые содержат эти двоеточия.
Спасибо
РЕДАКТИРОВАТЬ: Спасибо за ответ.В итоге я реализовал это так:
for tag in soup.find_all(True):
attrs = dict(tag.attrs)
for attr in attrs:
if ":" in attr:
del tag.attrs[attr]