У меня есть несколько простых функций, которые необходимо реализовать в каждой строке определенных столбцов моего информационного кадра.Фрейм данных очень похож, 10 миллионов + строк.Мой фрейм данных выглядит примерно так:
Date location city number value
12/3/2018 NY New York 2 500
12/1/2018 MN Minneapolis 3 600
12/2/2018 NY Rochester 1 800
12/3/2018 WA Seattle 2 400
У меня есть такие функции:
def normalized_location(row):
if row['city'] == " Minneapolis":
return "FCM"
elif row['city'] == "Seattle":
return "FCS"
else:
return "Other"
, а затем я использую:
df['Normalized Location'] =df.apply (lambda row: normalized_location (row),axis=1)
Это очень медленно,Как я могу сделать это более эффективным?