Извлечение слов из строки - PullRequest
0 голосов
/ 24 января 2020

У меня есть датафрейм. У меня есть столбец, в котором есть заявление, например: «Работал 25 дней в In AB C Company». Все, что мне нужно, чтобы извлечь «25 дней» и поместить его в новую колонку. Я использую scala с искрой. Какие-либо предложения?

1 Ответ

1 голос
/ 24 января 2020
df.withColumn("working_days", regexp_extract(col("statement"), """\d* days?""", 0))
  .where(length(col("working_days")) > 0)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...