Я изучаю концепции RDD в деталях, и однажды я запутался.Допустим, я применяю функцию 3 map вплотную, затем функцию фильтра и, наконец, соединение.Итак, здесь я применяю всего 3 преобразования, что означает 3 RDD.Но здесь есть одна загвоздка в том, что мои данные имеют размер 10 ТБ, и каждая карта даст 10 ТБ СДР каждый, что составляет 30 ГБ данных, что не является возможным решением.После прочтения я узнал, что в этом процессе будет создан только один RDD, и я не уверен, как он работает.Так может кто-нибудь может подробно рассказать мне об этом.