Как удалить дубликаты записей в существующей базе данных? (уникальное ограничение не определено) - PullRequest
0 голосов
/ 26 января 2020

Я работаю над проектом, в котором требуются улучшения схемы базы данных, скорости запросов и наследования шаблонов. Например, есть модель Menu , в которой отсутствуют уникальные ограничения (см. Ниже).

Чтобы улучшить целостность данных модели, я планирую добавить миграцию, добавив ограничение unique=True в поле season.

Перед применением миграции я проверил базу данных для всех Меню экземпляров, чтобы увидеть, может ли ошибка целостности потенциально произойти. В результате проверки есть 3 экземпляра модели с одинаковым значением, присвоенным season.

Я хочу удалить все, кроме 1, экземпляра Menu из существующей базы данных в этом дело, и не имеет значения, какой из них хранится. Каковы некоторые подходы к достижению этой цели?

class Menu(models.Model):
    season = models.CharField(max_length=20)
    items = models.ManyToManyField('Item', related_name='items')
    created_date = models.DateTimeField(
            default=timezone.now)
    expiration_date = models.DateTimeField(
            blank=True, null=True)

    def __str__(self):
        return self.season

1 Ответ

1 голос
/ 26 января 2020

Вы можете использовать код ниже, если вы используете Postgresql:

all_unique_season = Menu.objects.distinct('season').values_list('id', flat=True)
Menu.objects.exclude(id__in=all_unique_season).delete()

Также, если вы используете другие базы данных, вы можете использовать следующий код:

used_ids = list()
for i in Menu.objects.values('id', 'season'):
    used_ids.append(i['id'])
    Menu.objects.filter(season=i['season']).exclude(id__in=used_ids).delete()
...