У меня есть датафрейм. У меня есть столбец, в котором есть заявление, например: «Работал 25 дней в In AB C Company». Все, что мне нужно, чтобы извлечь «25 дней» и поместить его в новую колонку. Я использую scala с искрой. Какие-либо предложения?
df.withColumn("working_days", regexp_extract(col("statement"), """\d* days?""", 0)) .where(length(col("working_days")) > 0)