Question

У меня есть CSV-файл, состоящий из 12 столбцов данных, и я хочу создать матрицу корреляции с ними. Однако при этом с использованием pandas включаются только 4 (казалось бы, случайные) столбца. Есть идеи, почему оставшиеся столбцы не попадают в матрицу корреляции?

d = pd.read_csv('national_raw_convictions.csv')
cm = d.corr().abs()
cm.to_csv('national_raw_convictions_correlation.csv')

Я приложил снимок экрана со ссылками на входные (слева) и выходные (справа) файлы CSV. 1

alexeydemyanchuk · Answer 1 · 05 апреля 2020

Недостаточно информации, чтобы быть уверенным.

Я предполагаю, что столбцы имеют тип данных объекта. При чтении данных pandas старается понять тип данных столбцов. Но если по какой-то причине столбец имеет числа и строки, тип данных столбца будет «объект». Чтобы проверить типы данных в фрейме, вы можете запустить d.dtypes.

Надеюсь, это поможет.

Pandas корреляционная матрица, не включающая все столбцы в CSV-файле

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Pandas корреляционная матрица, не включающая все столбцы в CSV-файле

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы