С учетом фрейма данных df:
Column A: [0, 1, 3, 4, 6]
Column B: [0, 0, 0, 0, 0]
Цель состоит в том, чтобы условно заменить значения в столбце B. Если значения столбца A существуют в наборе assginedToA
, мы заменим соответствующие значения в столбце B напостоянная b
.
Например: если b = 1 и assignToA = {1,4}, результат будет
Column A: [0, 1, 3, 4, 6]
Column B: [0, 1, 0, 1, 0]
Мой код для поиска значений A и записи значений B в него выглядит следующим образом:
df.loc[df['A'].isin(assignedToA),'B']=b
Этот код работает, но это действительно медленно для огромного информационного кадра.Есть ли у вас какие-либо советы, как ускорить этот процесс?
Фрейм данных имеет около 5 миллионов строк, а assignedToA
имеет максимум 7 значений.