AttributeError: у объекта 'RDD' нет атрибута 'show' - PullRequest
0 голосов
/ 04 декабря 2018
from pyspark import SparkContext, SparkConf, sql
from pyspark.sql import Row
sc = SparkContext.getOrCreate()
sqlContext = sql.SQLContext(sc)
df = sc.parallelize([ \
                 Row(nama='Roni', umur=27, tingi=168), \
                 Row(nama='Roni', umur=6, tingi=168),
                 Row(nama='Roni', umur=89, tingi=168),])

df.show()

ошибка: трассировка (последний последний вызов):

Файл "ipython-input-24-bfb18ebba99e", строка 8, в df.show ()

AttributeError: у объекта 'RDD' нет атрибута 'show'

1 Ответ

0 голосов
/ 04 декабря 2018

Ошибка ясна, так как df является случайным.Вы должны изменить его на фрейм данных, используя toDF like в следующем коде:

df = df.toDF()
df.show()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...