Допустим, у меня есть файл, подобный этому:
apple 2018-01-01
apple cider 2018-01-05
apple cider 2017-01-06
lemon 2016-12-30
lemon 2017-12-31
lemon juice 2018-03-12
lemon pie 2018-03-30
Т.е. у него есть 1 или более текстовых столбцов, а затем дата. И некоторые текстовые записи дублируются на [разные] даты. Теперь я хочу удалить эти дубликаты:
apple 2018-01-01
apple cider 2017-01-06
lemon 2016-12-30
lemon juice 2018-03-12
lemon pie 2018-03-30
Будь то в одном столбце, можно было бы использовать это решение . Но что, если вместо поиска в определенном столбце я должен искать дубликаты через регулярное выражение? Может ли awk
справиться с этим? Или есть какие-то другие обходные пути?
Спасибо.