простое pandas слияние дает неожиданные результаты - получить структуру данных, но не ожидаемые данные - PullRequest
0 голосов
/ 28 мая 2020

Итак, я получаю неожиданные результаты - мое слияние включает 2 столбца в одной таблице, 3 столбца в другой с общим столбцом между ними. Слияние возвращает ожидаемую структуру данных из трех столбцов, но только результаты с одной стороны слияния (в основном копию одной стороны данных), поэтому одно поле не имеет значений, если я не выполняю внешнее соединение. Если я выполняю внутреннее соединение, я не получаю значений, хотя я ясно вижу общие значения. Использовали on_left и on_right с одинаковыми результатами. Никакие столбцы не индексируются.

Я использую Pandas v 1.0.3

DFA.merge(DFB, on=['queue'], how='left').fillna('').drop_duplicates() результаты

(illustrative - not actual results)
queue  group   app
Q1        G1
Q2        G2
Q3        G2
Q4
Q5        G4
Q5        G6

DFA.merge(DFB, on=['queue'], how='right').fillna('').drop_duplicates() результаты


(illustrative - not actual results)
app queue   group
10  Q1
20  Q3
30  Q3
40  Q4
10     

DFA.merge(DFB, on=['queue'], how='inner').fillna('').drop_duplicates() приводит к

(actual results)

да, результатов нет

Это кажется довольно простым - что мне здесь не хватает? Значения в файле очереди проверены на то, чтобы они были точно такими же в Excel. типы данных - все объекты (строки)

1 Ответ

0 голосов
/ 01 июня 2020

Пользователь вырезал пробелы из данных, а затем показал мне, что данные совпадают, затем отправил мне файл без его сохранения, чтобы в данных все еще были пробелы.

никогда не доверять никаким входным данным

Код в порядке.

...