Итак, я разобрался с проблемой и нашел решение
Проблема была в следующей строке: if 'comment' not in desired_title:
Что он сделал, так это только обработал HTML, который не сделал ' не содержать «комментарий». Проблема заключается в том, как структура HTML на странице, которую я пытался очистить, в основном, если бы у торрента был комментарий к нему, отображалась бы в структуре HTML выше, чем название заголовка. Поэтому мой код полностью пропустит торренты с комментариями к ним.
Вот рабочее решение:
import re, requests
from bs4 import BeautifulSoup
nyaa_link = 'https://nyaa.si/?q=test'
request = requests.get(nyaa_link)
source = request.content
soup = BeautifulSoup(source, 'lxml')
#GETTING TORRENT NAMES
title = []
n = 0
rows = soup.findAll("td", colspan="2")
for row in rows:
if 'comment' in row.find('a')['title']:
desired_title = row.findAll('a', title=True)[1].text
print(desired_title)
title.append(desired_title)
n = n+1
else:
desired_title = row.find('a')['title']
title.append(desired_title)
print(row.find('a')['title'])
print('\n')
#print(title)
#GETTING MAGNET LINKS
magnets = []
for link in soup.findAll('a', attrs={'href': re.compile("^magnet")}):
magnets.append(link.get('href'))
#print(magnets)
#GETTING NUMBER OF MAGNET LINKS AND TITLES
print('Number of rows', len(rows))
print('Number of magnet links', len(magnets))
print('Number of titles', len(title))
print('Number of removed', n)
Спасибо CannedScientist за часть кода, необходимого для решение