снимок экрана
![enter image description here](https://i.stack.imgur.com/DOltY.png)
полный снимок экрана
![enter image description here](https://i.stack.imgur.com/hSrM8.png)
Iобъединились в два RDD, используя pyspark, но, разбивая их и извлекая данные из таблицы, я получаю ошибки ниже
AttributeError: у объекта 'tuple' нет атрибута 'split'
код, над которым я работаю:
orderitems = sc.textFile("/user/zzz/data/retail_db/order_items/part-00000")
orderitemsmap = orderitems.map(lambda oi: (int(oi.split(",")[1]),float(oi.split(",")[4])))
ordersReduce = orderitemsmap.reduceByKey(lambda x,y:x+y)
orders = sc.textFile("/user/zzz/data/retail_db/orders/part-00000")
ordersmap = orders.map(lambda oi:(int(oi.split(",")[0]),oi.split(",")[3]))
orderstatus = ordersReduce.join(ordersmap)
renvStatus = orderstatus.map(lambda oi: oi.split(",")[1])
for i in renvStatus.take(10):print i