У меня есть набор данных в файле .csv, который я пытаюсь извлечь и назвать его столбцы. Я использую следующий код:
data_name = 'housing.csv'
column_names = ['CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX',
'RM', 'AGE', 'DIS', 'RAD', 'TAX', 'PTRATIO',
'LSTAT', 'MEDV']
data = pd.read_csv(data_name, names=column_names, error_bad_lines=False,
header=None)
Проблема в том, что он присваивает заголовки неправильным столбцам. Только последний столбец переименовывается, а другие добавляются, заполняются значениями NaN. Я также пытался использовать rename
с похожими результатами. Вот как выглядит print(data.head())
:
CRIM ZN ... LSTAT MEDV
0 0.00632 18.00 2.310 0 0.5380 6.5750 65... NaN ... NaN NaN
1 0.02731 0.00 7.070 0 0.4690 6.4210 78... NaN ... NaN NaN
2 0.02729 0.00 7.070 0 0.4690 7.1850 61... NaN ... NaN NaN
3 0.03237 0.00 2.180 0 0.4580 6.9980 45... NaN ... NaN NaN
4 0.06905 0.00 2.180 0 0.4580 7.1470 54... NaN ... NaN NaN
Есть идеи, как это решить?