Я ищу лучший способ исправить возможные ошибки в словах в строке без учета пунктуации. Я не хочу лишать его перед выполнением этой оценки, поскольку это приведет к изменению окончательно отредактированной строки. Мой текущий подход использует py-enchant (метод .check ()) после разделения строки на пробелы, но это не игнорирует пунктуацию.
misspelled_string = 'This is a (tesl strung.'
Желаемый результат:
corrected_string = 'This is a (test string.'
Попробуйте разделить все, что не является буквой, с помощью re:
re
import re misspelled_string = 'This is a (tesl strung.' res=re.split(r"[^\w]+", misspelled_string)
Вывод:
>>> res ['This', 'is', 'a', 'tesl', 'strung', '']