Вы можете использовать
spark_df_url.withColumn("new_column", regexp_extract("Page URL", "\d+", 0))
Укажите имя столбца строки в качестве первого аргумента для regexp_replace
и убедитесь, что третий аргумент установлен на 0
в качестве вашего В шаблоне нет групп захвата, и вы заинтересованы в получении полного значения совпадения в результате.
Обратите внимание, что когда вы указали 1
в качестве третьего аргумента, вы получите пустые результаты:
Если регулярное выражение не соответствует или указанная группа не соответствует, возвращается пустая строка.