Я пробовал разные способы сгруппировать данные в два разных столбца и с учетом весового коэффициента. К сожалению, я очень плохо знаком с Python. Я разобрался с несколькими вопросами и попытался найти половину решения. Не могли бы вы помочь мне с оставшимися или хотя бы дать идею?
ниже приведен макет кода:
data = pd.DataFrame({'sku_id' : ['s1', 's1', 's1', 's2','s2','s2','s3','s3','s3'],
'product_id' : ['p1','p1','p2','p1','p1','p1','p2','p2','p3']})
count_series = data.groupby(['product_id','sku_id']).size()
print('-'*30)
print(count_series)
print('-'*30)
agg_count = count_series.to_frame(name = 'weight').reset_index()
print(agg_count)
print('-'*30)
Вывод:
------------------------------
product_id sku_id
p1 s1 2
s2 3
p2 s1 1
s3 2
p3 s3 1
dtype: int64
------------------------------
product_id sku_id weight
0 p1 s1 2
1 p1 s2 3
2 p2 s1 1
3 p2 s3 2
4 p3 s3 1
------------------------------
Может кто-нибудь помочь мне сгруппировать столбец SKU_ID на основе их комбинации и происшествий. (это что-то вроде рекомендательного движка)
Желаемый вывод:
-----------------------
sku_id weight
s1 & s2 1
s2 & s3 0
s3 & s1 1
-----------------------