У меня есть кадр данных pandas с столбцом, названным периодом с 3 различными значениями маркировки, что означает зиму 2019, зиму 2020 и зиму 2021, как показано ниже
У меня вопрос: как заменить этот формат с конечным результатом: зима 2019, зима 2020 и зима 2021?
Period:
Q4 '19+Q1 '20
Q4 '20+Q1 '21
Q4 '21+Q1 '22
Q означает квартал в году
Итак, мой подход:
1) первым является метод регулярных выражений для создания столбца нового года. Я извлекаю номер 19, 20, 21 года после первого Q4
gas['year'] = gas['Period'].str.extract("([']\d\d)", expand=True)
Затем я планирую заменить значение, содержащее Q4 и Q1, на зиму на
gas['Period'].str.contains('Q4')) & (gas['Period'].str.contains('Q1')) = 'winter Gregorian'
но он заменил всю строку, содержащую Q4 и Q1
также пытался
gas[gas['Period'].str.replace("[Q][4]..\d\d[+][Q][1]", 'winter Gregorian'), regex =False]
и конечный результат, я хотел бы что-то вроде:
Period
winter Gregorian 2019
winter Gregorian 2020
winter Gregorian 2021
но не сработало, приветствую любые советы и предложения
спасибо