У меня есть датафрейм, который фиксирует код и его описание, нам нужно извлечь количество из описания. Пожалуйста, кто-нибудь может помочь извлечь количество с помощью регулярных выражений, это как число, за которым следует G / KG / L / ML
df
code description
1 ABC CHILLIE POWDER 100G
2 DEF POWDER 200G
3 DIL PDWR POWDER 100G
4 RAIN HILL HERB SOU GREED 40G 2 1FRE
5 DEAR CHILLI 200G+COCO POWDER 330ML
6 DIL PDWR 10L POWDER
result_df
code description qty
1 ABC CHILLIE POWDER 100G 100G
2 DEF POWDER 200G 200G
3 DIL PDWR POWDER 100G 100G
4 RAIN HILL HERB SOU GREED 40G 2 1FRE 40G
5 DEAR CHILLI 200G+COCO POWDER 330ML 200G
6 DIL PDWR 10L POWDER 10L
Iиспользую
df.withColumn("qty", F.regex_extract(F.col("description"), "\dG", 1)