Я хочу использовать sqlite для нумерации строк в CSV-файле по двум критериям: повторяющийся номер идентификатора и дата создания. (Я анализирую повторяющиеся данные аккаунта, сгенерированные DemandTools.) Просто, чтобы помочь объяснить, вот упрощенная версия того, что я хочу сделать:
Хочу превратить это:
Dupe Id # | Account Name | Created Date |
1882 | A1, Inc. | 03/15/2015 |
1567 | Joe's Plumbing | 08/01/2019 |
1567 | Joes plubming | 02/07/2020 |
1882 | A1 Corporation | 06/20/2019 |
1882 | A1 Incorporated | 05/16/2016 |
В это:
Dupe Id # | Account Name | Created Date | Dupe # |
1567 | Joe's Plumbing | 08/01/2019 | 0 |
1567 | Joes plubming | 02/07/2020 | 1 |
1882 | A1, Inc. | 03/15/2015 | 0 |
1882 | A1 Incorporated | 05/16/2016 | 1 |
1882 | A1 Corporation | 06/20/2019 | 2 |
Я хочу, чтобы исходная учетная запись имела значение 0, первый дублик 1, второй дублик 2 и т. д. c.
У меня был способ сделать это В Excel используется многостолбцовая сортировка и функция счетчика, такая как = COUNTIF (A $ 2: A2, A2) -1, но то, что работало в Excel для 100-тысячных строк и 10 столбцов, не работает с 700-тысячными строками и 24 столбцами.
Мои знания SQLite в настоящее время находятся на начальном уровне. Я понимаю основы, но не совсем уверен, с чего начать с такой проблемы. Я знаю, как сортировать по одному столбцу в SQLite, но я не знаю, как справиться с показательной частью проблемы (и, возможно, есть лучший способ с SQLite?).
Любая помощь очень признателен . , , .
Спасибо