Что такое команда spark для поиска операций, примененных к конкретному СДР? - PullRequest
1 голос
/ 27 октября 2019

Если мое значение СДР равно:

val a = sc.parallelize(1 to 5)

и после некоторого кода, если я забыл, какие операции были применены к a, что это за команда для поиска этих операций?

1 Ответ

0 голосов
/ 27 октября 2019

RDD.toDebugString предоставит вам необходимую информацию:

val a = sc.parallelize(1 to 5)
println(a.toDebugString)

отпечатки

(4) ParallelCollectionRDD[0] at parallelize at Test.scala:31 []

Вы можете найти более подробную информацию о том, как интерпретировать отладкустрока здесь .

Строка отладки содержит группу DAG без данных. Нет функции Spark, которая будет «записывать» все операции, включая данные. Если необходимо сохранить данные, можно попытаться перехватить Spark API с помощью AspectJ , но это потребует значительного объема работы.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...