Question

Я пытаюсь написать Perl-скрипт, который может открыть каталог и удалить дубликаты файлов, сравнив часть их имен и дату изменения.Я основал часть своего кода, используя алгоритм пузырьковой сортировки.

Проблема, с которой я сталкиваюсь, заключается в следующем: test12345.log, test34333.log, mytest11111.log, mytest22222.log и т. Д.Мне нужно удалить числовые значения в конце имени файла, а затем просто сравнить оставшиеся имена и дату изменения.test и test являются дубликатами, но какая из них имеет более старую измененную дату, поэтому я могу удалить ее?

Вот что я уже написал:

#!D:\Perl\bin\perl



opendir (DIR,".");
@array = grep(/.log/,readdir(DIR));
closedir (DIR);
foreach(@array){
    s/[0-9]{1}.log$//g;
    }

dlete(\@array);




sub dlete {
    my $array = shift;
    my $not_complete = 1;
    my $index;
    my $len = ((scalar @$array) - 2);
    while ($not_complete) {
        $not_complete = 0;
        foreach $index (0 .. $len) {
            if (@$array[$index] eq @$array[$index+1] && -M @$array[$index] > -M @$array[$index + 1]) {

                unlink "@$array[$index]";

                $not_complete = 1;
              }
       }
    }
}

Вопрос, который я задаю, выше кодировки.Я пытаюсь удалить дубликаты файлов из каталога, сравнивая их имена и дату изменения.Однако проблема в том, что имена файлов выглядят так: test12345.log, test34333.log mytest11111.log, mytest22222.log и т. Д. Мне нужно удалить числовые значения в конце имени файла, а затем просто сравнитьоставшиеся имена и дата изменения.например, test и test являются дубликатами, но у которых более старая модифицированная дата, поэтому я могу удалить ее

Caldrin · Answer 1 · 16 февраля 2012

Вот мое предложение для понимания вашей проблемы.

Поместите короткие имена в хеш
Проверьте для каждого файла, есть ли короткое имя в хэше.Если да, то
сравните время mtime файла с значением в хэше, используя функцию stat
, удалите старое, сохраните новое в хэше

пожалуйста, проверьте Win32 :: UTCFileTime для правильного времени при использовании статистики.

 use autodie; # error handling
 my %files;

 opendir (my $dir,".");
 foreach my $file( grep(/.log/,readdir($dir))){
    my $shortname = shorten($file);
    if ($files{$shortname}) {
          if (stat($file)[9] > $files{$shortname}->{mtime}) {
              unlink $files{$shortname}->{long};
              $files{$shortname}->{long} = $file;
              $files{$shortname}->{mtime} = stat($file)[9]
          } else {
              unlink $file
          }

     }
  }    
  closedir ($dir);

sarnold · Answer 2 · 18 февраля 2012

Ваш текущий код выбрасывает полное имя; тогда вы не сможете найти информацию об изменениях только с part из имени файла. Совет Caldrin сохранить хэш-сопоставление коротких имен для длинных имен - хорошая идея (Его текущая реализация выключена, но идея верна.)

Ваш текущий код сокращения также немного неверен:

foreach(@array){
    s/[0-9]{1}.log$//g;
}

Это удалит только одну цифру из имени файла: {1}. Если каждая цифра стоит удалить, то следующее выполнит работу:

foreach(@array){
    tr /0-9//d;  # s/\d*//g would also work
}

Как удалить дубликаты файлов, сравнив часть их имени и дату их изменения в Perl?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как удалить дубликаты файлов, сравнив часть их имени и дату их изменения в Perl?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов