Я знаю, как читать csv с помощью pyspark, но у меня много проблем с его загрузкой в правильном формате.У моего csv есть 3 столбца, где первый и второй - строки, а третий - список слов.Я не могу загрузить этот последний столбец.
Я пытался с
schema = StructType([
StructField("_id", StringType()),
StructField("text", StringType()),
StructField("links", ArrayType(elementType=MapType(StringType(), StringType())))
])
, но это вызывает ошибку.С Inferschema тоже не работает.