Я довольно новичок в Perl и надеялся, что кто-нибудь сможет мне помочь с этой проблемой.Мне нужно извлечь две колонки из файла CSV запятыми.Вот как выглядит формат:
"ID","URL","DATE","XXID","DATE-LONGFORMAT"
Мне нужно извлечь столбец DATE
, столбец XXID
и столбец сразу после XXID
.Обратите внимание, что каждая строка не обязательно следует за одинаковым количеством столбцов.
Столбец XXID
содержит двухбуквенный префикс и не всегда начинается с одной и той же буквы.Это может быть любая буква алфавита.Длина всегда одинакова.
Наконец, после извлечения этих трех столбцов мне нужно отсортировать по столбцу XXID
и подсчитать дубликаты.