Мне нужно регулярное выражение, которое поможет мне извлечь имя человека из строки, используя Stata.
Ниже приведены примеры строк:
name_adr
JAMES DeNORMANDIETrapelo Rd., Lincoln
JAMES A. KELLY, JR.Stafford St., Oxford
GEORGE WILLIAM SHATTUCKMt. Lebanon St., Pepperell
Ниже я нашел, что из них получилось:
name
JAMES DeNORMANDIE
JAMES A. KELLY, JR.
GEORGE WILLIAM SHATTUCK
Хитрость в том, что некоторые изимена имеют биты без заглавных букв.
Моя идея состояла в том, чтобы найти ту часть строки, где есть две последовательные заглавные буквы сзади. Простое регулярное выражение, которое я использовал, было [A-Z][A-Z][.*]$
, но даже это не работает.
Есть идеи, как поступить?