Как я могу преобразовать значение ключа rdd в rdd с помощью только списка значений в PySpark?
Предположим, что rdd имеет (key1, «это тест») и (key2, «сегодня»в воскресенье), я хочу преобразовать этот rdd в rdd, который имеет («это тест», «сегодня воскресенье»)
Пара значений ключа - user_id и твиты, и я хочу токенизироватьсначала твиты, и сообщать счет за токен.Затем следует проделать то же самое для определенной группы пользователей.Все в PySpark.