Я открыл кластер AWS EMR и в ноутбуке pyspark3 jupyter я запустил этот код:
"..
textRdd = sparkDF.select(textColName).rdd.flatMap(lambda x: x)
textRdd.collect().show()
.."
Я получил эту ошибку:
An error was encountered:
Invalid status code '400' from http://..../sessions/4/statements/7 with error payload: {"msg":"requirement failed: Session isn't active."}
Запуск строки:
sparkDF.show()
работает!
Я также создал небольшое подмножество файла, и весь мой код работает нормально.
В чем проблема?