у меня есть набор данных социальной сети, содержащий информацию о том, как мне нужно найти наиболее активного пользователя (например, пользователя, который дозирует больше всего), мои строки набора данных похожи на приведенные ниже
1000066:262792,273106,590979,1152305,1691577,1888250
и некоторые из них похожи на эти
1000073:private
1000069:notfound
вопросы 1: как сделать rdd любой строки таким образом, чтобы ключ всех пар rdd был первым числом, разделенным символом «:», и значениями по одномуодин разделенный с ','?Вопрос 2: как я могу решить эту проблему с помощью GraphX?Все, что мне нужно, это заранее найти наиболее активного пользователя в этом наборе данных, ответив на все эти вопросы тоже поможет