Есть параграф, и я хочу использовать регулярное выражение для извлечения всех слов внутри.
a bdag agasg it's the cookies for dogs',don't you think so? the word 'wow' in english means.you hey b 097 dag final
Я пробовал несколько регулярных выражений с re.findall (regX, str) и нашел такое, которое можетсоответствует большинству слов.
regX = "[ ,\.\?]?([a-z]+'?[a-z]?)[ ,\.\?]?"
['a', 'bdag', 'agasg', 'It's', 'the', 'cookies', 'for', 'dogs' ',' don 't ", 'you', 'think', 'so', 'the', 'word'," wow ' ",' in ',' english ',' означает ',' you ','эй', 'b', 'dag', 'final']
Все хорошо, кроме **wow'**
.
Интересно, могло бы регулярное выражение объяснить логику «это может быть запятая / пробел / точка / и т. Д., Но не может быть апострофом».
Может кто-нибудь посоветовать?