Я работаю над данными переписи, полученными от IPUMS.ORG. Формат файла ".dat".
Примерно как следующий код открыл файл dat. Но все данные объединены в один столбец. Я не уверен, что это лучший способ справиться с этим.
df = pd.read_csv('ipumsi_00002.dat')
>>df
1 250196825019680100000000100000002000000100002000
2 2501968250196801000000003000000020000002000020...
... #and thousand of more rows
Интересно, есть ли способ разбить каждую строку на числа разной длины? Такие как
id year country schooling educ ...
1 250 1968 25019680 100000 00010000 ...