Простой способ добавить комбинацию тегов, текста и ссылок в Beautifulsoup? - PullRequest
0 голосов
/ 20 ноября 2018

Я хочу вычеркнуть ссылки с веб-сайта и добавить их в свой ранее существующий список ссылок, пока я успешно справляюсь со скребком, но, похоже, я не могу сделать последний шаг, который добавляется ксуществующие ссылки.Позвольте мне проиллюстрировать:

Ссылка, которую мне удалось очистить:

scraped_ref = 'Case courtesy of Dr Sachintha Hapugoda, <a href="https://radiopaedia.org/">Radiopaedia.org</a>. From the case <a href="https://radiopaedia.org/cases/52525">rID: 52525</a> [Accessed 15 Nov. 2018].'

Мне нужно добавить следующий тег перед этой ссылкой:

<br>3. <b>Image: </b>

, который затем сделаетэто:

formatted_ref = '<br>3. <b>Image: </b>Case courtesy of Dr Sachintha Hapugoda, <a href="https://radiopaedia.org/">Radiopaedia.org</a>. From the case <a href="https://radiopaedia.org/cases/52525">rID: 52525</a> [Accessed 15 Nov. 2018].'

Затем, наконец, добавьте отформатированную ссылку в мой ранее существующий список ссылок:

existing_ref = <p class="references" style="font-size:15px">1. Mcminn. (2003). Last's Anatomy. Elsevier Australia. ISBN:0729537528. <a href="http://books.google.com/books?vid=ISBN0729537528">Read it at Google Books</a> - <a href="http://www.amazon.com/gp/product/0729537528">Find it at Amazon</a><br>2. Netter, F. H. (2019). Atlas of human anatomy. Philadelphia, PA: Elsevier.</p>

Я попробовал это:

for p in soup.find_all("p", {"class":"references"}):
    print(p.append('<br>3. <b>Image: </b>' + scraped_ref))

НоВ результате я потерял всю информацию тега:

<p class="references" style="font-size:15px">1. Mcminn. (2003). Last's Anatomy. Elsevier Australia. ISBN:0729537528. <a href="http://books.google.com/books?vid=ISBN0729537528">Read it at Google Books</a> - <a href="http://www.amazon.com/gp/product/0729537528">Find it at Amazon</a><br/>
2. Netter, F. H. (2019). Atlas of human anatomy. Philadelphia, PA: Elsevier.&lt;br&gt;3. &lt;b&gt;Image: &lt;/b&gt;Case courtesy of Dr Sachintha Hapugoda, &lt;a href="https://radiopaedia.org/"&gt;Radiopaedia.org&lt;/a&gt;. From the case &lt;a href="https://radiopaedia.org/cases/52525"&gt;rID: 52525&lt;/a&gt; [Accessed 15 Nov.2018].</p>

Что мне делать?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...