I have a column in pyspark dataframe which contain values separated by ;
+----------------------------------------------------------------------------------+
|name |
+----------------------------------------------------------------------------------+
|tppid=dfc36cc18bba07ae2419a1501534aec6fdcc22e0dcefed4f58c48b0169f203f6;xmaslist=no|
+----------------------------------------------------------------------------------+
Итак, в этом столбце может использоваться любое количество пар ключ-значение, если я использую это
df.withColumn('test', regexp_extract(col('name'), '(?<=tppid=)(.*?);', 1)).show(1,False)
Я могу извлечь tppid, но когда tppid становится последней парой ключ-значение в строке, которую он не может извлечь, я хочу regx, который может извлечь значение ключа, где бы он ни находился в строке.