Проблема идентификации Muti-label со временем и географическими компонентами - PullRequest
0 голосов
/ 05 марта 2020

В настоящее время я работаю над делом, в котором мне нужно сопоставить точки данных с указанным c ярлыком, зная только как информацию географические и временные данные.

Я нахожусь в контексте, где мой продукт распространяется по стране. После создания каждой единице продукта присваивается метка (также называемая идентификатором). Метка не является уникальной для единицы, фактически тысячи единиц имеют одинаковый идентификатор. После распределения по стране сообщается о части единиц (клиент недоволен, а затем сообщает, какую единицу он / она использовал). Для каждого отчета мы обязательно располагаем следующей информацией: - Дата отчета - Локализация клиента (долгота и широта) Однако мы не всегда знаем соответствующую метку единицы. Эта информация фактически сообщается только в 30% случаев.

Моя главная цель - найти ярлык в отчетах с недостающей информацией.

Чтобы решить эту проблему, мой подход заключается в оценке метки конкретного c единица измерения с помощью единиц с меткой, которые закрыты во времени и на расстоянии (это похоже на проблему триангуляции, но с временной составляющей). В конце я хотел бы иметь для каждой единицы без метки список потенциальных меток, которые могут быть связаны с этой единицей.

По размеру: у меня 100 000 единиц, у 25 000 из них есть ярлык, и я ищу, чтобы найти ярлыки для 75 000 других. Для этих 100 000 единиц они могут быть связаны с ~ 1000 различных ярлыков.

Я публикую сегодня, если вы сможете помочь мне найти правильные ресурсы, которые могут мне помочь, или если у вас также есть какое-либо решение с вашей стороны. Я не являюсь носителем языка Engli sh, поэтому сейчас я пытаюсь найти хорошие термины и слова, которые я должен использовать в Google, чтобы объяснить мою проблему.

Дайте мне знать, если у вас есть какие-либо вопросы.

Заранее благодарю за уделенное время!

...