Давая пример строки:
text = 'aaaaa 12345 aaaaa bbbbb 12345 bbbbb ccccc 12345 ccccc'
вместо этого вы используете re.split()
, может быть, вы можете использовать re.findall()
:
re.findall(r'\w+\s+\w+\s+\w+', text)
# output: ['aaaaa 12345 aaaaa', 'bbbbb 12345 bbbbb', 'ccccc 12345 ccccc']
Если вы хотите использовать re.split()
в любом случае вы можно поместить его в группу, а затем использовать генератор для очистки пробелов:
splitted = re.split(r'(\w+\s+\w+\s+\w+)', text)
#output: ['', 'aaaaa 12345 aaaaa', ' ', 'bbbbb 12345 bbbbb', ' ', 'ccccc 12345 ccccc', '']
[ele for ele in splitted if ele.strip()]
#output: ['aaaaa 12345 aaaaa', 'bbbbb 12345 bbbbb', 'ccccc 12345 ccccc']