У меня есть PySpark Dataframe
со столбцом strings
.Как я могу проверить, какие строки в нем являются числовыми.Я не смог найти ни одной функции в официальной документации PySpark -
values = [('25q36',),('75647',),('13864',),('8758K',),('07645',)]
df = sqlContext.createDataFrame(values,['ID',])
df.show()
+-----+
| ID|
+-----+
|25q36|
|75647|
|13864|
|8758K|
|07645|
+-----+
В Python есть функция .isDigit()
, которая возвращает True
или False
, если string
содержит только цифры или нет.
Ожидаемый фрейм данных -
+-----+-------+
| ID| Value |
+-----+-------+
|25q36| False |
|75647| True |
|13864| True |
|8758K| False |
|07645| True |
+-----+-------+
Я бы хотел избежать создания UDF
.