Следующий код разбивает строку на список слов, но не включает цифры:
txt="there_once was,a-monkey.called phillip?09.txt"
sep=re.compile(r"[\s\.,-_\?]+")
sep.split(txt)
['there', 'once', 'was', 'a', 'monkey', 'called', 'phillip', 'txt']
Этот код дает мне слова и цифры, но по-прежнему содержит "_" в качестве допустимого символа:
re.findall(r"\w+|\d+",txt)
['there_once', 'was', 'a', 'monkey', 'called', 'phillip', '09', 'txt']
Что мне нужно изменить в любом фрагменте кода, чтобы получить желаемый результат:
['there', 'once', 'was', 'a', 'monkey', 'called', 'phillip', '09', 'txt']