У меня есть следующий html-код (или, по крайней мере, я думаю, что это html), над которым я работаю с BeautifulSoup на Python.
Я правильно проанализировал html, используя Beautiful soup. Далее я хотел бы получить содержимое, связанное с элементом div, содержащим определенную метку данных (например, в нижней части кода, data-label = "Relation"). В частности, я хотел бы получить словарь, который имеет в качестве ключа текст метки данных, т.е. в моем примере «Отношение», и в качестве значения содержимое того же «div», т.е. в моем примере href »http://documenti.camera.it/apps/commonServices/getDocumento.ashx?sezione=bollettini=comunicato=17=2016=06=14=03=data.20160614.com03.bollettino.sede00020.tit00010.int00010=data.20160614.com03.bollettino.sede00020.tit00010.int00010#data.20160614.com03.bollettino.sede00020.tit00010.int00010"
Я пробовал несколько подходов, но метка данных, насколько мне известно, не является допустимым атрибутом, поэтому я не уверен, как с этим справиться.
(Обратите внимание, что это всего лишь пример, но мне придется сделать то же самое для тысяч, если не миллионов, таких веб-страниц с такой же структурой).
Любая помощь приветствуется. Спасибо!