Я объединил два набора данных, и это не отношение 1 к 1.Теперь я должен определить наилучшее совпадение (между строками) на основе временной задержки.
Я пробовал это в MySQL и в R и не смог ничего найти.
Мой начальныйданные выглядят так:
data <- data.frame("sent_id" = c(1,1,2,2,3,3,3,4,4,4),
"recieved_id" = c(100,101,100,101,105,106,107,105,106,107),
"delay" = c('00:00:00','15:00:00','-00:14:59','00:00:01','23:00:05','00:01:00',
'-18:00:00','15:00:00','23:00:00','00:30:10'))
И я хочу закончить примерно так:
data2 <- data.frame("sent_id" = c(1,1,2,2,3,3,3,4,4,4),
"recieved_id" = c(100,101,100,101,105,106,107,105,106,107),
"delay" = c('00:00:00','15:00:00','-00:14:59','00:00:01','23:00:05','00:01:00',
'-18:00:00','15:00:00','23:00:00','00:30:10'),
'best_match' = c(TRUE, FALSE, FALSE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, TRUE))