Как убрать перекрытия с помощью R - PullRequest
0 голосов
/ 29 октября 2019

Итак, у меня есть некоторые данные, которые говорят об уникальных посещениях для каждого сайта. Теперь они перекрываются, так как люди посещают несколько веб-сайтов. Таким образом, пользователь, посетивший site1, мог также посетить site3 и site4. Так что для уникальных посещений на сайте 1 может быть 20M вместо 23M. Таким образом, чтобы устранить перекрытия, мы получили процентное перекрытие между каждой парой веб-сайтов. Исходя из этого, как я могу рассчитать фактические уникальные посещения для каждого веб-сайта.

tibble::tribble(
      ~X1, ~unique_visits, ~site1, ~site2, ~site3, ~site4, ~site5, ~site6, ~site7,
  "site1",       23873274,    100,   96.1,   95.6,     95,   91.6,   96.6,   92.9,
  "site2",        4249486,   54.1,    100,   46.2,   46.5,   56.9,   77.5,   43.2,
  "site3",         887786,   47.2,   40.5,    100,   41.5,   38.5,   55.3,     85,
  "site4",        3727497,   41.7,   36.3,   36.9,    100,   38.6,   56.3,   51.5,
  "site5",        1833995,   23.7,   26.2,   20.2,   22.8,    100,     28,   87.5,
  "site6",        1617476,    5.1,    7.3,    5.9,    6.8,    5.7,    100,    2.9,
  "site7",         760829,    0.2,    0.2,    0.4,    0.3,    0.8,    0.1,    100
  )

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...