Не удалось прочитать файл DAT из онлайн-источника в Python - PullRequest
0 голосов
/ 23 мая 2018

Я не смог прочитать этот dat файл в python.

Я попробовал следующее:

url3 = 'https://www2.census.gov/programs-surveys/saipe/datasets/2002/2002-state-and-county/est02all.dat'
import pandas as pd
saipe02 = pd.read_csv(url3, sep='\s+', header=None, skiprows=1)

Или:

import numpy as np
saipe02 = np.fromfile(url3)

но они не работают.Работает только этот код, но я не могу поставить разделитель для разделения данных на столбцы.Я пробовал много разделителей, но это не работает:

saipe02=pd.read_table(url3,header=None)

1 Ответ

0 голосов
/ 23 мая 2018

у меня работает read_fwf, документы :

saipe02 = pd.read_fwf(url3, header=None)
print (saipe02.head())
   0   1         2         3     ...       30  31            32         33
0   0   0  34569951  33912173    ...      NaN  US  est02ALL.dat  29OCT2004
1   1   0    679856    646828    ...      NaN  AL  est02ALL.dat  29OCT2004
2   1   1      4795      3728    ...      NaN  AL  est02ALL.dat  29OCT2004
3   1   3     16175     12558    ...      NaN  AL  est02ALL.dat  29OCT2004
4   1   5      6152      4767    ...      NaN  AL  est02ALL.dat  29OCT2004

[5 rows x 34 columns]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...