У меня есть данные о продажах продукта (1 столбец на продукт) на уровне клиента (1 строка на клиента). Я оцениваю, какие клиенты будут более заинтересованы в конкретном продукте c. У меня есть список 10 самых коррелированных продуктов. (и у меня есть это для нескольких продуктов, поэтому я пытаюсь построить масштабируемый подход). Я пытаюсь оценить всех клиентов, основываясь на том, сколько из этих 10 продуктов они покупают.
Допустим, мой список: prod_x_corr_prod
Как создать столбец оценки (скажем, prox_x_propensity), который проходит через 10 соответствующих столбцов, для каждой строки и для каждого столбца со значением> 0 добавляет 1?
Например, если покупатель Y купил 3 продукта, связанных с продуктом X, он получит 3 балла в столбце "prox_x_score".
РЕДАКТИРОВАТЬ: благодаря всех вас за обратную связь.
Для клиента 5 я бы получил 2, в то время как для 1,2,3 я получил бы 1. Для 4, 0.