У меня есть файл с разделителями канала с различным количеством столбцов, например:
id|name|attribute|extraattribute
1|alvin|cool|funny
2|bob|tall
3|cindy|smart|funny
Я пытаюсь найти элегантный способ импортировать это в фрейм данных, используя pyspark. Я мог бы попытаться исправить файлы, чтобы добавить конечный | когда отсутствует последний столбец (может отсутствовать только последний столбец), но он хотел бы найти решение, не включающее изменение входных файлов.