У меня есть кадр данных в R, как показано ниже:
structure(list(Sales = c(1, 0, 4, 4, 2, 3, 3, 0, 2, 2), Txn_count = c(1,
0, 1, 2, 1, 2, 1, 0, 1, 1), VPP = c(1, NaN, 4, 2, 2, 1.5, 3,
NaN, 2, 2), prob = c(0.99, 0.81, 0.7, 0.8, 0.47, 0.59, 0.75,
0.99, 0.53, 0.72), row_Sales = c(0.99, NaN, 2.8, 1.6, 0.94, 0.885,
2.25, NaN, 1.06, 1.44)), row.names = c(NA, -10L), class = "data.frame")
Столбец VPP (стоимость каждой покупки) рассчитывается как продажи / транзакции для каждой строки.
У меня есть sales_actual_vpp рассчитывается как
sum(probabilities)*[sum(sales)/sum(transaction)]
т.е.
sum(column D)*[sum(column A)/sum(column B)]
Это дает значение как 15,435
Теперь я хочу вменять значения NA в столбец row_Sales
такой, что разница между sales_actual_vpp
и sum(column row_Sales)
после вменения сводится к минимуму. Обратите внимание, что все значения NA будут заменены на одно и то же значение, так что разница по-прежнему будет минимальной
Как мне добиться этого в R с помощью решателя?