Как выбрать несколько столбцов, которые случайно присутствуют в RDD, используя RDD - PullRequest
0 голосов
/ 02 июля 2019

У меня есть RDD, который содержит около 15 столбцов.Я хочу создать RDD с 8 столбцами.все 8 столбцов случайно присутствуют в наборе данных или RDD1.как выбрать эти столбцы с помощью API карты?

исходные данные содержат следующие столбцы

['pid,encounter_nr,addr_str,addr_str_nr,addr_zip,date_birth,sex,bill_item_bill_no,bill_item_code,bill_item_desc,bill_item_units,bill_item_amount,bill_item_date,state,district,country']

обязательные столбцы:

('pid','encounter_nr','sex','date_birth','addr_zip','bill_item_code','bill_item_desc','bill_item_amount','bill_item_date')
...