Я пытаюсь взять из файла все правильные слова. Допустимые слова определяются как обычные символы, которые могут выглядеть следующим образом:
don't won't can't
и я должен игнорировать запятые и восклицательные знаки.
Я получил выражение, чтобы получить только символы, но теперь оно не получит таких слов, как don't and can't or won't
.
Это выражение, которое я использую "[^A-Za-z]+"
, и я пробовал "\'[^A-Za-z]+"
, но это ломает и разрешает все символы. Кто-нибудь знает, что я могу использовать, чтобы получить нормальные слова, в том числе не и не будет и не может и такие слова.
Большое спасибо