У меня есть два набора данных, которые мне нужно объединить, но есть еще одна проблема, потому что качество данных не очень хорошее.
Два набора данных: Звонки (телефонные звонки) и Связь (записи, созданные о телефонных звонках). У них есть идентификаторы call_id и comm_id соответственно. Записи связи также имеют call_ids для выполнения соединения. Проблема в том, что система сбора данных не работала правильно с самого начала, и у меня большое количество сообщений, которые я не могу сопоставить с конкретным вызовом. Не все вызовы будут генерировать сообщение.
Для каждого дня мне нужно создать объединенный список, чтобы провести некоторый анализ.
Проблема в том, что из-за отсутствия некоторых ссылок я получаю 3 разных типа строк:
- Just Calls,
- Just Comms,
- Связанный комм и звонок.
Что я хочу сделать, так это то, что для каждой строки, которая является строкой «Just Comm» на данную дату, я должен удалить строку «Just Call» для той же даты. Мне не нужны значения из звонков, мне просто нужно знать, что звонок произошел. Если я сделаю это, я получу правильное количество строк, потому что все «just comms» удалят строку «just call», которая, насколько мне нужно знать, была вызовом, который создал comm.
Моя проблема в том, как сделать это в службах SSIS. Я дошел до того, что у меня есть мой набор данных, который содержит все необходимые мне данные и представляет собой смесь трех типов строк, которые я упомянул выше. Как бы вы посоветовали мне пройти процедуру удаления строк "Просто позвоните"?