Я пытаюсь объединить (объединить), используя внешнее объединение так, чтобы результат содержал строки с идентификатором в столбце 0 и все столбцы из обоих файлов.
Мои файлы содержат заголовки в первой строке.
Я перепробовал множество вариантов, но продолжаю получать сообщения об ошибках с жалобами. Хотя в стеке потока много примеров, ни один из них не дает ответов об используемой методологии.
Файлы имеют заголовки с заголовком первого столбца = «Код», а поле ключа на самом деле состоит из 5 цифр. Я не уверен, вызывает ли это у меня проблемы.
df1 = pd.read_csv('file1.csv', header=[0], index_col=['Code'])
df2 = pd.read_csv('file2.csv', header=[0], index_col=['Code'])
и я попробовал
df1 = pd.read_csv('file1.csv', header=[0])
df2 = pd.read_csv('file2.csv', header=[0])
Я пробовал варианты ...
dfx = pd.merge(df1, df2, left_on=['Code'], right_on=['Code'], how='outer')
dfx = df1[['Code','A-Score']].merge(df2[['Code','B-Score']], how='outer')
df1.merge(df2, on=['Code'], how='outer')
df = pd.merge(df1[['Code', 'Field1', 'Field2']], df2['Code', 'Field3', 'Field4'], on='Code', how='outer', suffixes=('-A','-B'))
dfx = pd.concat([df1,df2], axis=1, join='outer')
Я хочу, чтобы все строки из обоих файлов были объединены в один файл. В обоих файлах нет повторяющихся ключей.
Так что я просто хочу выполнить довольно простое объединение двух файлов и понять, какие параметры требуются и где / почему.
Postedit:
Моя проблема в том, что ключ интерпретируется как числовой, поскольку я могу объединить строковый ключ Таким образом,
Как мне
1. Переопределить ключ как строковый, а не числовой?
2. Как мне указать ключ как int64?