Question

Я работаю над данными переписи, полученными от IPUMS.ORG. Формат файла ".dat". Примерно как следующий код открыл файл dat. Но все данные объединены в один столбец. Я не уверен, что это лучший способ справиться с этим.

 df = pd.read_csv('ipumsi_00002.dat')
>>df
 1    250196825019680100000000100000002000000100002000    
 2    2501968250196801000000003000000020000002000020...  
 ... #and thousand of more rows

Интересно, есть ли способ разбить каждую строку на числа разной длины? Такие как

     id  year  country  schooling  educ     ...  
 1   250 1968  25019680  100000    00010000 ...

Как правильно обращаться с файлом .dat и форматировать его на Python?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Как правильно обращаться с файлом .dat и форматировать его на Python?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Нет похожих вопросов