ValueError: Вход содержит NaN, бесконечность или значение, слишком большое для dtype ('float64'), но id - нет, обнаружение аномалий - PullRequest
0 голосов
/ 11 декабря 2018

Мои данные имеют следующий аспект:

    h=df1.iloc[[2]]

    output:
    action_query               10424567
    Day                               
    2017-09-20                       0
    2017-09-21                       0
    2017-09-22                       0
    2017-09-23                       2
    2017-09-24                       0
    2017-09-25                       0
    2017-09-26                       1
    2017-09-27                       0

Я хочу применить обнаружение аномалий (эллиптический конверт) для каждого запроса action_query на основе его компиляции по дням.Но когда я запускаю точные данные выше, он возвращает следующую ошибку:

    from sklearn.covariance import EllipticEnvelope
    outliersfin=[]
    for i in range(len(df1)):
        Elliptic= EllipticEnvelope(contamination=0.0010)
        h=df1.iloc[[i]]
        h1=h.transpose()
        Elliptic.fit(h1)
        outliers= Elliptic.predict(h1)
        outlierfin.append(outliers)

   ValueError: Input contains NaN, infinity or a value too large for dtype('float64')

Все значения имеют формат int, так что это не проблема.

    h.dtype()
    Day          int64
    action_query int64
...