Файл, сгенерированный из API, содержит данные, подобные приведенным ниже
col1,col2,col3
503004,(d$üíõ$F|'.h*Ë!øì=(.î; ,.¡|®!®3-2-704
, когда я читаю в spark, он выглядит примерно так.я использую case case для чтения из RDD, затем преобразую его в DataFrame, используя .todf.
503004,������������,������������������������3-2-704
, но я пытаюсь получить значение типа
503004,dFh,3-2-704-- only alpha-numeric value is retained.
я использую spark 1.6 иscala.
Пожалуйста, поделитесь своим предложением