Я использую BeautifulSoup для разбора веб-страницы стихов.Поэзия разделена на h3
для названия стихотворения и .line
для каждой строки стихотворения.Я могу получить оба элемента и добавить их в список.Но я хочу манипулировать h3
в верхнем регистре и указывать разрыв строки, а затем вставить его в список строк.
linesArr = []
for lines in full_text:
booktitles = lines.select('h3')
for booktitle in booktitles:
linesArr.append(booktitle.text.upper())
linesArr.append('')
for line in lines.select('h3, .line'):
linesArr.append(line.text)
Этот код добавляет все названия книг в начало списка, а затем продолжает получать элементы h3
и .line
.Я попытался вставить код следующим образом:
linesArr = []
for lines in full_text:
for line in lines.select('h3, .line'):
if line.find('h3'):
linesArr.append(line.text.upper())
linesArr.append('')
else:
linesArr.append(line.text)