У меня есть фрейм данных, содержащий данные электронной почты потребителя - свежие и повторные контактные электронные письма.Мне нужно найти выбросы в этих данных на основе определенных условий:
- условие 1:
count1 > 1
и count 2 > 1
- условие 2:
count1 > 1
и count 2 < 1
Я проверил определение функции, синтаксис в python и соответственно определил функцию для классификации выбросов.
def outlier():
for index, row in df.iterrows():
if([row][count1] > 1 and [row][count2] > 1):
if(df[row][Journey] == df[row][journey_lag]):
df[row][outlier] = Same_Property/Date/Agent/Journey
else:
df[row][outlier] = Same_Property/Date/Agent-Different Journey
elif([row][count1] > 1 and [row][count2] == 1):
if(df[row][Journey] == df[row][journey_lag]):
df[row][outlier] = Same_Property/Date-Different_Agent/Journey
else:
df[row][outlier]=Same_Property/Date_Different_Agent/Journey
return df
Я ожидаю выполнить эту функцию с кадром данных следующим образом:
df.outlier
df.apply(outlier)
Ошибка: не удалось получить результаты запроса