У меня есть файл в формате .bcp и я пытаюсь его прочитать. Строки разделены "| ;; |". Строка может занимать несколько строк в файле.
rdd = sc.textFile("test.bcp")
разбивает файл на строки, но мне нужно, чтобы он был отделен "| ;; |". Как я могу сделать это без изменения конфигурации Had oop?
Пример .bcp
:
A1|;|B1|;|C1|;|
D1|;;|A2|;|B2|;|
C2|;|D2|;;|
следует преобразовать в: [["A1", "B1", "C1", "D1"], ["A2", "B2", "C2", "D2"]]