У меня есть два кадра данных. Кадр данных A (с именем data2_) имеет 2,5 миллиона строк и 15 столбцов, а кадр данных B (именованные данные) - 250 строк и 4 столбца. Оба имеют соответствующий столбец: IDENTITY.
Я хочу сократить Dataframe A до тех строк, которые соответствуют строке IDENTITY Dataframe B.
Я пытался это сделать, но вычисление занимает много времени (оценка tqdm в год):
for i in tqdm(list(range(data2_.shape[0]))):
for t in list(range(data.shape[0])):
if data2_["IDENTITY"].iloc[i] != data["IDENTITY"].iloc[t]:
data2_.drop( index = i)
else:
pass