Удаление строк в Excel, где значение ячейки не повторяется в других строках - PullRequest
1 голос
/ 01 августа 2020

У меня есть таблица с 1362 строками данных. В столбце A указана дата, а в столбце B - номер идентификатора. Остальные столбцы содержат баллы за экзамен и некоторые расчеты, основанные на этих баллах. Существует 1053 уникальных ID # и 201 ID #, которые повторяются хотя бы один раз. Некоторые идентификационные номера повторяются более одного раза. Я хочу удалить строки, чтобы получить первую и последнюю меру только для каждого повторяющегося ID #. Это означает, что мне нужно удалить все строки для ID #, которые возникли только один раз; и мне нужно повторить все строки для ID #, которые были повторены, но были не первым или последним экземпляром. Я сделал это с меньшим набором данных (несколько сотен) через пару месяцев go, и мне придется продолжать делать это по мере роста набора данных в будущем, где может быть много тысяч строк. Когда я сделал это в прошлый раз, я отсортировал данные по идентификатору № и по дате, затем я прошел вручную и удалил все строки, которые мне не нужны. В этот раз я начал делать то же самое, но понимаю, что это займет слишком много времени и займет целую вечность, когда набор данных станет больше. Ваша помощь очень ценится! Спасибо.

1 Ответ

1 голос
/ 01 августа 2020

Вы можете использовать несколько вспомогательных столбцов, которые помогут вам отсортировать / удалить строки, которые вам не нужны. Рассмотрим следующий снимок экрана.

Данные сортируются по идентификатору, а затем по дате, поэтому все повторяющиеся идентификаторы находятся в соседних строках.

Формула в столбце «помощник 1» создает текущий счетчик для каждый идентификатор.

=IF(B2<>B1,1,C1+1)

Формула в столбце «помощник 2» затем определяет первый и последний номер для каждого идентификатора и отмечает его.

=IF(C2=1,IF(OR(ISBLANK(C3),C3=1),"delete","keep"),IF(C2>C3,"keep","delete"))

Теперь вам нужно скопировать Вспомогательный столбец 2 и вставьте его как значения, чтобы результаты не изменились при другой сортировке данных. Затем отсортируйте по Помощнику 2 (который теперь содержит текст, а не формулы) и удалите все строки с флагом «удалить».

Занимает меньше минуты.

введите описание изображения здесь

...