Я хочу посмотреть на частоты переменной во фрейме данных внутри списка.
Для этого я использую pd.crosstab.Вот весь код ниже:
#create a list first
numdata={}
vars=['INITIAL_AMOUNT','LINE_AMOUNT','OUTSTANDING_DEBT'] ##these are names of few column in my sql table
#loop over sql columns and store them in a list
for names in vars:
chunks=pd.read_sql('SELECT ['+names+'] FROM mydb.dbo.mytable', conn, chunksize=100000)
numdata[names]=pd.concat(chunks)
names=numdata[names].apply(pd.to_numeric, errors='coerce')
#now look at the tabulation of a variable
pd.crosstab(index=numdata['INITIAL_AMOUNT'],columns="count")
Я получаю следующую ошибку:
ValueError: Shape of passed values is (1, 2), indices imply (9054058, 2).
Вы имеете представление о том, что я делаю неправильно?Thx