Я использую Azure Блоки данных с использованием PySpark для ноутбуков.
Ниже приведен пример текстового файла Orders.txt : -
Order1|Prod1|345|3|
Order1|Prod2|45|1|
Order1|Prod3|105|2|
Order2|Prod1|345|1|
Order2|Prod4|459|2|
Order2|Prod3|105|1|
FileName|6|
Мне нужно создать 2 RDD с помощью PySpark из приведенного ниже Пример файла.
1 СДР (он не должен содержать последний файл) 2 СДР (он должен содержать только последнюю строку)