У меня огромный массив данных (38 миллионов строк):
df = pd.DataFrame({'I':[1,2,3,4], 'C':[80,160,240,80],
'F':[(1,2,3,4),(5,7,2),(9,6,2,5,7),(4,0,8,3,2)]})
C F I
0 80 (1, 2, 3, 4) 1
1 160 (5, 7, 2) 2
2 240 (9, 6, 2, 5, 7) 3
3 80 (4, 0, 8, 3, 2) 4
Теперь я хотел бы отфильтровать строки, содержащие число 3
в 'F'
.give:
C F I
0 80 (1, 2, 3, 4) 1
3 80 (4, 0, 8, 3, 2) 4
Есть ли способ сделать это с высокой производительностью и низким использованием памяти?
Я пробовал np.equal((3), df['F'].values).all()
, но это, очевидно, не работает