Как использовать Панды, чтобы соответствовать порядку данных - PullRequest
0 голосов
/ 25 января 2019

У меня есть два набора данных в таком текстовом формате.

enter image description here

Первый столбец - это идентификатор пользователя, а последний столбец - это функция. Два файла находятся в форме (500k, 3) и (480k, 3). Второй файл включен в первый файл. Я хочу сопоставить тот же порядок идентификатора пользователя и удалить недостающие. Как я могу сделать это эффективно?

1 Ответ

0 голосов
/ 25 января 2019

Что-то в приведенных ниже строках должно решить эту проблему.

import pandas as pd

df1 = pd.read_csv('your_file1.txt',sep=' ',names=['col1','col2','col3'])
df2 = pd.read_csv('your_file2.txt',sep=' ',names=['col1','col2','col3'])

df1.merge(df2,how='inner',on='col1')
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...