У меня более 10k файлов, как показано в примере ниже. Я хотел бы отфильтровать частичный дубликат, т.е. 123456
является общим во всех перечисленных файлах, которые считаются дубликатами, и из этих дублированных файлов мне нужен файл с последними отметками времени
123456_20200425-012034.xml
123456_20200424-120102.xml
123456_20200425-121102.xml
234567_20200323-112232.xml
123456_20200423-111102.xml --- consider that this file is having latest
timestamps out of all above duplicate file
Как это сделать using bash?
Также на выходе должны быть файлы, которые не дублируются. Это означает, что из 10K файлов несколько файлов не дублируются, и эти файлы должны быть включены в вывод.
Требуется вывод типа (файлы последних отметок времени)
123456_20200423-111102.xml
234567_20200323-112232.xml