Предположим, что если мы используем инкрементальный импорт в sqoop для импорта данных из RDMS в Hadoop, а некоторые данные, которые мы уже импортировали в hadoop, ранее были обновлены в RDMS, и когда мы снова импортируем с использованием инкрементального импорта sqoop, мы также получим эти недавно обновленные данные, которые уже присутствовал в нашем Hadoop, что приводит к дублированию данных, так как мы можем избежать дублирования данных при импорте данных с использованием sqoop в таких сценариях?