У меня есть фрейм данных test
со столбцом category
, содержащим сложную комбинацию слов, символов и цифр.Мне нужно извлечь слова, разделенные дефисом перед другим, а затем цифры в новый столбец sub_category
.
Я не эксперт по регулярным выражениям и потратил слишком много времени на борьбу с ним.Так что оценим вашу помощь!
test = pd.DataFrame({
'id': ['1','2','3','4'],
'category': ['worda-wordb-1234.ds.er89.',
'worda-4567.we.77-ty','wordc-wordd-5698/de/','wordc-2356/rt/']
})
Желаемый вывод:
id category sub_category
0 1 worda-wordb-1234.ds.er worda-wordb
1 2 worda-4567.we.ty worda
2 3 wordc-wordd-5698/de/ wordc-wordd
3 4 wordc-2356/rt/ wordc