Следующее было выполнено в оболочке PySpark, модуль datetime разрешает формат времени
>>> t = datetime.datetime.strptime('10:41:35', '%H:%M:%S').time()
>>> type(t)
<class 'datetime.time'>
Когда вышеуказанная функция применяется к кадру данных с использованием карты, она завершается неудачно, так как PySpark не ' время типа данных не может быть выведено.
>>> df2.select("val11").rdd.map(lambda x: datetime.datetime.strptime(str(x[0]), '%H:%M:%S').time()).toDF()
TypeError: Can not infer schema for type: <class 'datetime.time'>
Модуль pyspark.sql.types
на данный момент поддерживает только следующие типы данных
NullType
StringType
BinaryType
BooleanType
DateType
TimestampType
DecimalType
DoubleType
FloatType
ByteType
IntegerType
LongType
ShortType
ArrayType
MapType
StructField
StructType