Наконец-то я решил сам.
Похоже, это была проблема, связанная с Glue / AWS, а не с искрой или питоном.
После нескольких испытаний я получил сообщение об ошибке, в котором говорится, что операция "ListObject" не удаласьпри запуске Spark (pyspark) REPL.
ListObject - это, очевидно, имя API-вызова boto3 для доступа к содержимому на S3.
Поэтому я проверил его роль IAM, в которой уже был включен AWSGlueConsoleFullAccess с некоторым S3Access, прикрепленным к нему.Политика AmazonS3FullAccess к нему, и ошибка исчезла.
Кроме того, я сделал еще один кластер конечной точки разработки клея, а также не было ошибки на новом кластере, даже без S3FullAccess.
Может быть, каждый раз, когда яРазбудив Spark на клеевом кластере, кластер автоматически пытается получить какое-то обновление из некоторого назначенного сегмента S3, и иногда он сталкивался с проблемами при сборке кластера непосредственно перед выпуском какого-либо обновления.