Смысл сценария в том, чтобы разбить блок текста на предложения, а затем сгенерировать случайное число, чтобы увидеть, выделено ли предложение или нет. Когда приведенный ниже код выполняется, он вырезает все отдельные предложения и вставляет их в конец документа. Я ищу предложения, которые будут заменены, а не добавлены в конце.
from docx import Document
import re
from nltk import tokenize
import Funtion
import random
from docx.enum.text import WD_COLOR_INDEX
doc = Document('raw.docx')
rawdata = (Funtion.gettext('raw.docx'))
sen = tokenize.sent_tokenize(rawdata)
senlen = len(sen)
p = doc.add_paragraph()
for indsen in sen:
rng = random.randint(1,11)
if rng == 8:
p.add_run(indsen).font.highlight_color = WD_COLOR_INDEX.YELLOW
doc.save('TTTCH.docx')