Я должен отфильтровать много строк данных и найти дубликаты в позиции 1-49 символов.Следующий первый дубликат остается там, а дубликаты удаляются.Скрипт должен быть в скрипте оболочки.Я читал о сортировке, uniq, но не смог найти правильный пример.
Дублированные строки от 1 до 49 символов должны быть удалены и сохранены только первыми.В примере строки: ALA1FZX 00013019040220180402SFOSINSFOSIN78Z78Z24 дублируется 4 раза и сохраняется только сначала из строки 1.
У меня есть этот пример строк:
ALA1FZX 00013019040 * 012 10024 * ZZZFF ALA1FZX 00013019040220180402SFOSINSFOSIN78Z78Z215 * +1011 * ALA1FZX 00013019040220180402SFOSINSFOSIN78Z78Z225
*
ALA1FZX 00013019040220180402SFOSINSFOSIN78Z78Z235 1015
ALA1FZX 00013019040220180402SFOSINSFOSIN78Z78Z24 2
1020 ** * ALA1FZX тысяча двадцать один 00013019040220180402SFOSINSFOSIN78Z78Z24 * * тысяча двадцать-два4
ALA1FZX 00013019040220180402SFOSINSFOSIN78Z78Z24 5
Вывод должен быть:
1030 * ALA1FZX 00013019040220180402SFOSINSFOSIN78Z78Z241 1032 * ALA1FZX 00013019040220180402SFOSINSFOSIN78Z78Z215 1034 * ALA1FZX 00013019040220180402SFOSINSFOSIN78Z78Z225
ALA1FZX 00013019040220180402SFOSINSFOSIN78Z78Z235