Добавьте две таблицы сопряженности в Python - PullRequest
1 голос
/ 13 марта 2019

Я создаю систему рекомендаций, для которой я создаю таблицу непредвиденных расходов, чтобы понять связь между продуктами.

Моя таблица непредвиденных расходов выглядит следующим образом, например, Tble-1:

   a  b  c  d
a  2  1  1  1
b  1  2  2  0
c  1  2  2  0
d  1  0  0  1 

Это фрейм данных Pandas.

Поскольку я работаю с потоковыми данными, мне нужно обновлять эту таблицу непредвиденных обстоятельств всякий раз, когда я получаю новые данные.

Предположим, я получил новую таблицу непредвиденных обстоятельств, скажем, Table-2:

   a  b  c  e
a  2  1  1  4
b  1  1  2  0
c  1  2  4  2
e  1  3  0  4 

Мне нужно добавить две таблицы непредвиденных обстоятельств, т. Е. Table-1 + Table-2, что приведет к новой таблицеследующим образом:

   a  b  c  d  e
a  4  2  2  1  4
b  2  3  4  0  0
c  2  4  6  1  4
d  1  0  0  1  0
e  1  3  0  0  4

Как мне достичь этого в питон-пандах?

1 Ответ

1 голос
/ 13 марта 2019

Используйте DataFrame.add с параметром fill_value=0 для несопоставленных значений, затем замените несуществующие значения и при необходимости преобразуйте в целое число:

df = df1.add(df2, fill_value=0).fillna(0).astype(int)
print (df)
   a  b  c  d  e
a  4  2  2  1  4
b  2  3  4  0  0
c  2  4  6  0  2
d  1  0  0  1  0
e  1  3  0  0  4
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...