Question

У меня есть два набора данных, содержащих имена.Каков упрощенный питонский способ подмножества df2, чтобы он содержал только строки, которые содержит df1 (имя, фамилия).Спасибо.

import pandas as pd

names1 = {
    'index' : [1, 2, 3], 
    'col1'  : ['John', 'Jerry', 'John'],
    'col2'  : ['Doe', 'Peters', 'Smith']
}




names2 = {
    'index' : [1, 2, 3, 4], 
    'col1'  : ['John', 'Bob','Jerry', 'John'],
    'col2'  : ['Smith', 'Lacko', 'Peters', 'Nowak'],
    'col3'  : [12, 13, 14, 15]
}


df1 = pd.DataFrame(names1).set_index(["index"])
df2 = pd.DataFrame(names2).set_index(["index"])

print(df1,'\n')
print(df2)

        col1    col2
index               
1       John     Doe
2      Jerry  Peters
3       John   Smith 

        col1    col2  col3
index                     
1       John   Smith    12
2        Bob   Lacko    13
3      Jerry  Peters    14
4       John   Nowak    15

желаемый вывод:

       col1   col2   col3
index                     
1      John   Smith    12
3      Jerry  Peters   14

jezrael · Answer 1 · 19 октября 2018

Используйте reset_index до merge, а затем set_index:

df = df2.reset_index().merge(df1).set_index('index')
print (df)
        col1    col2  col3
index                     
1       John   Smith    12
3      Jerry  Peters    14

, поскольку только merge потеряноисходные значения индекса:

print (df2.merge(df1))
    col1    col2  col3
0   John   Smith    12
1  Jerry  Peters    14

Подстановка фрейма данных двумя столбцами из другого фрейма данных

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Подстановка фрейма данных двумя столбцами из другого фрейма данных

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов