Удаление повторяющихся строк на основе критерия для файла в unix - PullRequest
0 голосов
/ 18 февраля 2020

У меня есть файл данных, извлеченный из таблицы. Теперь я должен сохранить строки с последней отметкой времени для идентификатора, если существует несколько записей для идентификатора, если они существуют. Необходимо удалить другие старые строки ввода. Файл нужно очистить.

Id | timestamp | status
3 | 17-Feb-20 12:30:00:00 PM | E
1 | 16-feb-20 09:30:00:00 Am | L
3 | 17-Feb-20 15:30:00:00 PM | N
2 | 17-Feb-20 10:12:00:00 Am | L

Мне нужно сохранить идентификатор 1,2, так как есть только одна запись. Но идентификатор 3 имеет две строки, но должен сохранить одну с отметкой времени 15:30, поскольку это самое последнее.

Я получил ссылку на использование 'sed' cmd для удаления определенного номера строки или конкретной строки. Но дело в том, что я буду читать построчно. Скажем, зацикливание первой строки будет идентификатором 3, я добавлю grep в тот же файл для сопоставления идентификатора, если он существует. Таким образом, для id 3 я получил другой матч, а затем сравню метку времени. Поскольку текущая строка, на которой я работаю, имеет более старую временную метку, необходимо удалить строку с татами и сохранить последнюю. Можно ли выполнить операцию над тем же файлом, который я буду читать, или, очевидно, go с другим файлом ??

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...