Какой самый быстрый способ сделать проверку и отбрасывание двух асимметричных фреймов данных - PullRequest
1 голос
/ 27 июня 2019

У меня есть два кадра данных. Кадр данных A (с именем data2_) имеет 2,5 миллиона строк и 15 столбцов, а кадр данных B (именованные данные) - 250 строк и 4 столбца. Оба имеют соответствующий столбец: IDENTITY.

Я хочу сократить Dataframe A до тех строк, которые соответствуют строке IDENTITY Dataframe B.

Я пытался это сделать, но вычисление занимает много времени (оценка tqdm в год):

for i in tqdm(list(range(data2_.shape[0]))):
    for t in list(range(data.shape[0])):
        if data2_["IDENTITY"].iloc[i] != data["IDENTITY"].iloc[t]:
            data2_.drop( index = i)
        else:
            pass
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...