У меня довольно большая таблица с 19 000 000 записей, и у меня проблема с дублирующимися строками.Есть много подобных вопросов даже здесь, в SO, но ни один из них, кажется, не дает мне удовлетворительного ответа.Некоторые моменты, которые следует учитывать:
- Уникальность строки определяется двумя столбцами:
location_id
и datetime
. - Я бы хотел, чтобы время выполнения было максимально быстрым (<1 час). </li>
- Копирование таблиц не очень выполнимо, поскольку размер таблицы составляет несколько гигабайт.
- Не нужно беспокоиться об отношениях.
Как сказанокаждый location_id
может иметь только один отдельный datetime
, и я хотел бы удалить все повторяющиеся экземпляры.Неважно, кто из них выживет, поскольку данные идентичны.
Есть идеи?