Сопоставьте или соедините два CSV-файла как наборы данных с python - PullRequest
0 голосов
/ 05 марта 2020

У меня есть два набора данных в формате CSV. Эти наборы данных имеют разные столбцы (количество столбцов и даже их заголовки), хотя я знаю, что некоторые из них являются общими, моя проблема заключается в поиске общих столбцов. Основное решение c - тестирование одной или всех комбинаций столбцов в двух наборах данных. Есть ли какое-либо решение, модель или подход, чтобы прочитать их оба и найти общий столбец (столбцы) для представления максимального числа записей соответствия? Например, с python или pandas.

1 Ответ

0 голосов
/ 05 марта 2020

Вы можете найти это с пересечением в pandas. По сути, вы читаете оба CSV в двух кадрах данных, а затем находите пересечение столбцов, что даст вам вызов общих столбцов

import pandas as pd

df1 = pd.read_csv("file1.csv")
df2 = pd.read_csv("file2.csv")
common_cols = df1.columns.intersection(df2.columns)
...