pd.crosstab: просмотр частот переменной из словаря - PullRequest
0 голосов
/ 26 сентября 2019

Я хочу посмотреть на частоты переменной во фрейме данных внутри списка.

Для этого я использую pd.crosstab.Вот весь код ниже:

#create a list first
numdata={}  
vars=['INITIAL_AMOUNT','LINE_AMOUNT','OUTSTANDING_DEBT'] ##these are names of few column in my sql table  
#loop over sql columns and store them in a list                         
for names in vars:
    chunks=pd.read_sql('SELECT ['+names+'] FROM mydb.dbo.mytable', conn, chunksize=100000)
    numdata[names]=pd.concat(chunks)
    names=numdata[names].apply(pd.to_numeric, errors='coerce')
#now look at the tabulation of a variable
pd.crosstab(index=numdata['INITIAL_AMOUNT'],columns="count")

Я получаю следующую ошибку:

ValueError: Shape of passed values is (1, 2), indices imply (9054058, 2).

Вы имеете представление о том, что я делаю неправильно?Thx

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...