У меня есть следующий исходный файл. В моем файле есть имя "john
", которое я хочу разделить на список ['j','o','h','n']
. Пожалуйста, найдите файл человека следующим образом.
Исходный файл:
id,name,class,start_data,end_date
1,john,xii,20170909,20210909
Код:
from pyspark.sql import SparkSession
def main():
spark = SparkSession.builder.appName("PersonProcessing").getOrCreate()
df = spark.read.csv('person.txt', header=True)
nameList = [x['name'] for x in df.rdd.collect()]
print(list(nameList))
df.show()
if __name__ == '__main__':
main()
Фактический результат:
[u'john']
Требуемый выход:
['j','o','h','n']