Итак, у меня есть некоторые данные, которые говорят об уникальных посещениях для каждого сайта. Теперь они перекрываются, так как люди посещают несколько веб-сайтов. Таким образом, пользователь, посетивший site1
, мог также посетить site3
и site4
. Так что для уникальных посещений на сайте 1 может быть 20M
вместо 23M
. Таким образом, чтобы устранить перекрытия, мы получили процентное перекрытие между каждой парой веб-сайтов. Исходя из этого, как я могу рассчитать фактические уникальные посещения для каждого веб-сайта.
tibble::tribble(
~X1, ~unique_visits, ~site1, ~site2, ~site3, ~site4, ~site5, ~site6, ~site7,
"site1", 23873274, 100, 96.1, 95.6, 95, 91.6, 96.6, 92.9,
"site2", 4249486, 54.1, 100, 46.2, 46.5, 56.9, 77.5, 43.2,
"site3", 887786, 47.2, 40.5, 100, 41.5, 38.5, 55.3, 85,
"site4", 3727497, 41.7, 36.3, 36.9, 100, 38.6, 56.3, 51.5,
"site5", 1833995, 23.7, 26.2, 20.2, 22.8, 100, 28, 87.5,
"site6", 1617476, 5.1, 7.3, 5.9, 6.8, 5.7, 100, 2.9,
"site7", 760829, 0.2, 0.2, 0.4, 0.3, 0.8, 0.1, 100
)