Я пытаюсь извлечь несколько строк из нескольких скобок в pandas df и создать новые столбцы.
Следующая строка находится в одном столбце df:
Unfurnished 1 Bdrm 1st flr Flat. Hall. Lounge. Kitch. Bdrm. Shower rm (CT band - A). Deposit & references required. No pets. No smokers. Rent £500 p.m Entry by arr. Viewing Owner 07425 163047 or contact solicitors. Landlord reg: 305350/110/22531. (EPC band - C).
Я пытался извлечь данные диапазона CT и EP C в 2 новых столбца (по одному для каждого набора информации соответственно). Я пробовал несколько версий кода, а также пытался использовать информацию из https://regex101.com/r/5XjNqh/1
Пример: приведенный ниже код
properties['Council_tax']=properties.Description.str.extract('(\(CT[^()*&?%])',expand=False)
возвращает
(CT
Ожидаемый результат:
| Description | Council_tax_band | EPC_band |
|--------------------|------------------|----------|
| Above string | A | C |
| Example string 2 | B | F |
| Example string 3 | C | D |
В то же время слово 'Band' также встречается как 'band' .
Я не думаю, что у меня есть хороший gr asp по правильному использованию регулярных выражений. Есть идеи?