Я предлагаю вам сначала разбить текст на отдельные слова, включая знаки препинания
text = ["This is an example, it contains 1.0 number and some words."]
raw_list = text.split()
Теперь вы можете удалить знаки препинания в конце элемента.
cleaned_words = []
for word in raw_list:
if word[-1] in ['.', ',', '!', '?']:
cleaned_words.append(word[:-1])
else:
cleaned_words.append(word)
Примечание 1: Если ваш текст содержит числа, такие как 1.
для 1.0
, вам также необходимо принять во внимание второй последний символ и оставить точку, если isdigit()
оценивается как True
Примечание 2: , если существуют предложения, заканчивающиеся несколькими знаками препинания, вы должны запустить цикл while, чтобы удалить их, а затем добавлять только после того, как не будет найдено никаких знаков препинания.
while True:
if word[-1] in ['.', ',', '!', '?']:
word = word[:-1]
else:
break
cleaned_words.append(word)