Категоризация данных с использованием панд - PullRequest
0 голосов
/ 20 октября 2018

введите описание изображения здесь Я пытаюсь выполнить тест хи-квадрат для набора данных, и для этого мне нужно использовать pd.cut() для формулирования категорий в наборе данных.Однако я получаю эту ошибку

ufunc 'subtract' не содержит цикла с типами соответствия сигнатуры dtype ('

Мой код:

import pandas as pd
import numpy as np
import scipy as sp
import math

data_main = pd.read_csv("sample_survey.csv")
data = data_main.iloc[:, [1,2]]

data["wrkstat"] = data["wrkstat"].astype(str)
data["marital"] = data["marital"].astype(str)
cols = ['wrkstat', 'marital']

cut_points = ['Divorced', 'Married', 'Never Married', 'Seperated','Widowed']
label_names = ['Divorced1', 'Married', 'Never Married', 
'Seperated','Widowed']
data["Marital_Categories"] = pd.cut(data["marital"], cut_points)

marital_by_wrkstat = data[['wrkstat', 'marital_categories']]
marital_by_wrkstat.head()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...