сравнивая временные последовательности - PullRequest
1 голос
/ 11 сентября 2010

Я пытаюсь обернуться вокруг этой задачи и задаюсь вопросом, существует ли стандартный способ сделать это или некоторые библиотеки, которые были бы полезны.

Определенные события отслеживаются и синхронизируются в нескольких источниках данных S1... SN.Записанная информация является типом события и отметкой времени.Может быть несколько событий одного типа последовательно или они могут быть прерывистыми.Могут быть «пропущенные» события - то есть, когда один из источников пропускает его, и, наоборот, когда источник вводит «ложное срабатывание».Как правило, существует разница во времени между наблюдениями одного и того же события в разных источниках.Эта разница во времени имеет постоянную составляющую из-за физического местоположения источников, но может также иметь переменную составляющую, обусловленную задержкой в ​​сети и другими факторами.

Мне нужно найти алгоритм, который бы нашел оптимальный максимальный интервал времени, которыйследует использовать для группировки наблюдений во всех источниках в одном «наблюдаемом событии» и позволить обнаружение пропущенных событий и ложных срабатываний.

Мне интересно, действительно ли решение находится где-то в поле статистики, а не в алгоритмах,Любой вклад будет высоко ценится.

1 Ответ

1 голос
/ 30 ноября 2010

Звучит так, как будто вы строите систему посещаемости :-) В системе, которую я создаю в настоящее время, такой вид группирования наблюдений также необходим. В моем случае есть сотрудники, у которых есть пропуск, который они ставят перед паролем, чтобы зарегистрировать свою посещаемость. Сначала система выберет все посещаемости от одного сотрудника. Затем он положит их в коробки по одному дню, заказанные по времени регистрации. Каждая регистрация будет оцениваться с точки зрения начала или остановки. Если первая регистрация является начальной регистрацией, то система будет искать регистрацию остановки максимум через 12 часов. Если остановка не наступает, вставляется остановка. Дополнительные сведения могут быть введены в действие, когда планирование известно. Возможно, вы могли бы использовать статистику, но в моем случае речь шла об алгоритмах в сочетании со знаниями организации.

...