Когда я запускаю свой код, я получаю ошибку:
NameError: имя 'df_test' не определено
Я не получаю эту ошибку на другомкомпьютер, но на моем новом я делаю.Я думаю, что это связано с глобальными и локальными переменными, но это странно, поскольку переменные, созданные во второй ячейке, фактически используются в третьей ячейке, проблема возникает в четвертой ячейке.
Я попытался указать глобальные, а затем переменные в первой ячейке, это не работает.Делать это в третьей ячейке, действительно работает.Но я не хочу продолжать это делать, потому что с моего другого компьютера я знаю, что это ненормально.
### cell 1
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split,cross_val_score,ShuffleSplit
import os
import scipy
### cell 2
df=pd.read_csv("pandas2.txt",sep=';').drop('listened',axis=1).drop('Usercount',1)
temp_u=df['User'].unique()
temp_s=df['Song'].unique()
avg=df['rating'].mean()
### cell 3
lamda=0.05
gamma=0.04
m=128
splits=20
df_train,df_test=train_test_split(df,test_size=0.1, random_state=1)
beta_u=pd.DataFrame(temp_u,columns=['User'])
beta_s=pd.DataFrame(temp_s,columns=['Song'])
beta_u['beta_u']=0
beta_s['beta_s']=0
for chunk in np.array_split(df_train, splits):
x=chunk.merge(beta_u, on='User',how='left').merge(beta_s,on='Song',how='left')
x['pred']=avg+x['beta_u']+x['beta_s']+(x[pnames]*x[qnames]).sum(axis=1)
x['gradu']=gamma*(x['rating']-x['pred']-lamda*x['beta_u'])
beta_u=beta_u.merge(x[['User','gradu']].groupby('User').mean(),on='User',how="left").groupby('User').mean().fillna(0)
beta_u['beta_u']+=beta_u['gradu']
beta_u=beta_u.drop(['gradu'],axis=1)
x['grads']=gamma*(x['rating']-x['pred']-lamda*x['beta_s'])
beta_s=beta_s.merge(x[['Song','grads']].groupby('Song').mean(),on='Song',how="left").fillna(0)
beta_s['beta_s']+=beta_s['grads']
beta_s=beta_s.drop(['grads'],axis=1)
x[pgrad]=(x[qnames].multiply(x['rating']-x['pred'], axis="index")+np.array(x[qnames]**2)*np.array(x[pnames]))#.divide((x[qnames]*x[qnames]).sum(axis=1),axis=0)
beta_u=beta_u.merge(x[['User']+pgrad].groupby('User').mean(),on='User',how="left").fillna(0)
beta_u[pnames]=beta_u[pgrad]#np.array(beta_u[pnames])+np.array(beta_u[pgrad])
beta_u[pnames]=np.where(beta_u[pnames]>0,beta_u[pnames],10**(-6))
beta_u=beta_u.drop(pgrad,1)
x[qgrad]=(x[pnames].multiply(x['rating']-x['pred'], axis="index")+np.array(x[pnames]**2)*np.array(x[qnames]))#.divide((x[pnames]*x[pnames]).sum(axis=1),axis=0)
beta_s=beta_s.merge(x[['Song']+qgrad].groupby('Song').mean(),on='Song',how="left").fillna(0)
beta_s[qnames]=beta_s[qgrad]#np.array(beta_s[qnames])+np.array(beta_s[qgrad])
beta_s[qnames]=np.where(beta_s[qnames]>0,beta_s[qnames],10**(-6))
beta_s=beta_s.drop(qgrad,1)
x=df_test.merge(beta_u, on='User',how='left').merge(beta_s,on='Song',how='left').fillna(0)
x['pred']=x['beta_u']+x['beta_s']+avg+(np.array(x[pnames])*np.array(x[qnames])).sum(axis=1)
x['pred2']=np.where(x['pred']>0.5,1,0)
RMSE=np.mean((x['rating']-x['pred'])**2)
RMSE2=np.mean((x['rating']-x['pred2'])**2)
print(RMSE)
print(RMSE2)
### cell 4
t=len(df_test)
sim_Song=pd.DataFrame(scipy.sparse.load_npz('simUser.npz').todense())
sim_Song.index=pd.read_csv('Itemnames.csv',sep=';')['Song']
sim_Song.columns=pd.read_csv('Itemnames.csv',sep=';')['Song']
beta_s=beta_s.set_index('Song')
NameError: имя 'df_test' не определено
И когда global df_train, df_test, df, x, beta_s, beta_u
помещается поверх ячейки 3, она отлично работает