Вы можете использовать findall с этим регулярным выражением r'Year.*?\\n'
, чтобы перехватить подстроки.Затем создайте строку из списка найденных элементов с помощью ''.join
, а затем удалите последний \n
с помощью [:-2]
:
import re
df['Column1'] = df['Column1'].apply(lambda x: ''.join(re.findall('Year.*?\\n', x))[:-2])
Или, если после 4 цифр года всегда есть\n
, вы можете сделать так:
df['Column1'] = df['Column1'].apply(lambda x: '\n'.join(re.findall('Year-\d\d\d\d', x)))