Входные данные содержат NaN, бесконечность или значение, слишком большое для dtype ('float64'), но нет значений nan или бесконечного - PullRequest
3 голосов
/ 25 мая 2019

Входные данные содержат NaN, бесконечность или слишком большое значение для dtype ('float64')

Это ошибка, которая появляется, когда я запускаю свой код для логистической регрессии с использованием библиотеки Scikit.

Я пытался удалить nan и бесконечные значения, но он не работает

    df=pd.read_csv("bots.csv")
    df1=pd.read_csv("genuine.csv")

    df1.head

    np.where(df.values >= np.finfo(np.float64).max)
    np.where(df1.values >= np.finfo(np.float64).max)

    np.any(np.isnan(df))
    np.any(np.isnan(df1))

    np.all(np.isfinite(df))
    np.all(np.isfinite(df1))

    df1=df1[:-92]  #drop from bottom

    f_to_f_human=df['friend_to_folowers_ratio']
    f_to_f_bot=df1['friend_to_folowers_ratio']

    df1['Y']= 1 #1 for bot
    df['Y'] = 0 # 0 for human

    vx=df['Y']
    vy=df1['Y']

    A = pd.concat([df1, df])
    A

    y=A.iloc[:,-1].values
    X=A.drop(['Y'], axis=1)
    X=A.iloc[:].values
    X_train,X_test,y_train, y_test= 
    train_test_split(X,y,test_size=0.2,random_state=42)

    model=LogisticRegression(penalty='l2',C=1)
    print(X_train)
    model.fit(X_train,y_train)

Я не ожидаю никаких ошибок, но появляется ошибка

Входные данные содержат NaN, бесконечность или слишком большое значение для dtype ('float64')

1017 *

...