В pyspark sparkSession
, с sc
в качестве моего sparkContext
, вызывая getRDDStorageInfo()
Java sparkContext, _jsc.sc()
, метод возвращает экземпляр JavaObject RDDInfo[]
, который я могу перебрать в python.
sc._jsc.sc().getRDDStorageInfo()
возвращает JavaObject id=o473
Так работает следующее:
for s in sc._jsc.sc().getRDDStorageInfo():
print s.name()
print s.memSize()
print s.numPartitions()
print s.numCachedPartitions()
Однако метод Java sparkContext listFiles()
возвращает JavaObject со значением scala.collection.Seq<String>
.
sc._jsc.sc().listFiles()
возврат JavaObject id=o475
и когда я пытаюсь повторить это, я получаю TypeError: 'JavaObject' object is not iterable
Как я могу преобразовать JavaObject scala.collection.Seq<String>
в список питонов (или другой итеративный питон)?