У меня есть 2 переменные, одна с «последним томом», а другая с «последней проблемой».
HTML-код, с которым я имею дело, содержит список всех томов и проблем, в первую очередь самых последних.
Мне нужно вернуть ссылки href для всех томов и проблем, которые новее, чем у меня в файле.
Итак, используя приведенный ниже пример, скажем, мой последний том - 13, а последний выпуск - 1, мне нужно вернуть href для тома 13, 2 и тома 14, 1.
Мне трудно с этим, так как объем сам по себе ...
Вот что у меня есть:
HTML:
<ul class="bobby">
<li><strong>Volume 14</strong></li>
<li class="">
<a href="/content/ben/cchts/2011/00000014/00000001" title="Issue 1, September 2011">Issue 1, September 2011</a>
</li>
<li><strong>Volume 13</strong></li>
<li class="">
<a href="/content/ben/cchts/2010/00000013/00000002" title="Issue 2, December 2010">Issue 2, December 2010</a>
</li>
<li class="">
<a href="/content/ben/cchts/2011/00000014/00000001" title="Issue 1, November 2011">Issue 1, November 2011</a>
</li>
</ul>
Сценарий отрублен:
results = soup.find('ul', attrs={'class' : 'bobby'})
#temp until I get it reading from file
lastVol = '13'
#find the last volume
findlastVol = results.findNext('strong', text= re.compile('Volume ' + lastVol))
#temp until I get it reading from file
lastIss = '2'
#find the last issue
findlastIss = findlastVol.findNext('a', text= re.compile('Issue ' + lastIss))
Так что я могу добраться до тега для последнего тома и проблемы в файле, но у меня было несколько неудачных попыток вернуться назад и остановиться в первой проблеме ...
Или начиная с вершины и проходя вниз, пока не будут выполнены условия объема и выпуска ...
Может кто-нибудь помочь мне? Спасибо.