Я пытаюсь получить образцы из текста, используя RegEx:
John Doe
JOHN DOE
Sam John Watson
Sam John Lilly Watson
SAM JOHN WATSON
SAM JOHN LILLY WATSON
Входные данные содержат только одну строку, и мне нужно найти выше шаблоны в этом.
Подробнее о шаблоне
- Каждое слово начинается с заглавной буквы, за которой следует заглавная или строчная буква
- Минимум 2 слова
- Максимум 4 слова
- Слова будут включать только символы AZ или az
То, что я пробовал:
import re
re.findall("[A-Z][A-Za-z]+ [A-Z][A-Za-z]+ [A-Za-z]* [A-Za-z]*", text)
Что будет правильно определять ввод, например:
Sam Peters John Doe
SAM WINCH DAN BROWN
но не удается ввести менее 4 слов.