Pandas корреляционная матрица, не включающая все столбцы в CSV-файле - PullRequest
0 голосов
/ 05 апреля 2020

У меня есть CSV-файл, состоящий из 12 столбцов данных, и я хочу создать матрицу корреляции с ними. Однако при этом с использованием pandas включаются только 4 (казалось бы, случайные) столбца. Есть идеи, почему оставшиеся столбцы не попадают в матрицу корреляции?

d = pd.read_csv('national_raw_convictions.csv')
cm = d.corr().abs()
cm.to_csv('national_raw_convictions_correlation.csv')

Я приложил снимок экрана со ссылками на входные (слева) и выходные (справа) файлы CSV. 1

1 Ответ

0 голосов
/ 05 апреля 2020

Недостаточно информации, чтобы быть уверенным.

Я предполагаю, что столбцы имеют тип данных объекта. При чтении данных pandas старается понять тип данных столбцов. Но если по какой-то причине столбец имеет числа и строки, тип данных столбца будет «объект». Чтобы проверить типы данных в фрейме, вы можете запустить d.dtypes.

Надеюсь, это поможет.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...