Динамически создавать столбцы DataFrame из метаданных - PullRequest
3 голосов
/ 23 марта 2020

Я новичок в Python и Databricks.

У меня есть данные в текстовом файле без заголовков столбцов.

'|' является разделителем значения столбца в этом текстовом файле

У меня есть сведения об именах столбцов и их порядке в отдельном файле Excel.

Мне нужно создать DataFrame с подробностями столбцов что у меня есть, то я должен импортировать строки данных в нем

Пожалуйста, предложите лучший способ создания столбцов DataFrame, где я должен поддерживать детали этих столбцов (имена, тип, Заказ)

Пример данных в текстовом файле: -

C1|CL1|23|dsfr|54|hjhg|nnf|hb
C1|CL2|23|dsfe|344|er|nnf||fg
C1|CL3|23|dsef|364|e|nnf|fg
C2|CL1a|2783|d56sfr|54|hjhg|nbvc|hb
C2|CL2a|253|dsf56e|344|er|hjhgf||fyyg
C2|CL3a|2673|dse56f|364|e|tre|ttt|yy

Подробности заголовка: -

Col1(string)
Col2(string)
Col3(number)
..
..

Обратите внимание, что на самом деле, У меня есть более 300 столбцов с типом string, number, DateTime, bool

1 Ответ

0 голосов
/ 23 марта 2020

headers_df = pd.read_csv('path to headers csv') headers = headers_df.values.tolist()

Назначить имя столбца

pd.read_csv('path/to/file/without_header.csv',sep='|',names=headers)

надеюсь, что это ответ на ваш вопрос

...