У меня есть документ, который мне нужно предварительно обработать с помощью spaCy. Мне нужно удалить все слова, которые выделены жирным шрифтом в документе.
Я попробовал следующее:
def delete_paragraph(paragraph):
p = paragraph._element
p.getparent().remove(p)
p._p = p._element = None
length = len(document.paragraphs)
for i in range(0,length):
for j in range(0,len(document.paragraphs[i].runs)):
if document.paragraphs[i].runs[j].bold == True:
delete_paragraph(document.paragraphs[i])
length = length-1
continue
document.save("/home/nikita/Desktop/Internship/new topic_mod/AXIS new.docx")
Но я получаю следующую ошибку:
IndexError: Traceback (most recent call last)
<ipython-input-12-d144bd42e95e> in <module>()
3 #print(document.paragraphs[i].text)
4 for j in range(0,len(document.paragraphs[i].runs)):
----> 5 if document.paragraphs[i].runs[j].bold == True:
6 delete_paragraph(document.paragraphs[i])
7 length = length-1
IndexError: list index out of range
Я не могу понять, почему это вне диапазона.
Как я могу удалить жирные слова из python-docx?
Пожалуйста, помогите!