У меня есть набор данных, похожий на этот:
http://pastie.org/private/3u1reg72nnjfsgqzgqzwra
Список - это набор имен файлов, которые необходимо обработать. Если имя файла с подстрокой 10u
существует вместе с именем с подстрокой 2u
, имя файла с 10u
содержит подмножество данных из файла с подстрокой 2u
. Другими словами, когда у вас есть что-то вроде:
20021203_V9ut_2u.txt
20021203_V9ut_10u.txt
or
V9cd_2u.txt
V9cd_10u.txt
20021203_V9ut_10u.txt
и V9cd_10u.txt
должны быть удалены из списка, и только имена файлов с 1u
должны оставаться в списке.
Я пробовал несколько разных методов, но все они слишком похожи на С или хакерские. Я также думал о разделении строки и создании хэша со значениями 1u
или 10u
, а затем, если существует ключ со значением 10u
, замените его на 1u
, иначе отбросьте затем переназначить хэш в массив для обработки содержимого файла.
Каков «лучший» или самый рубиновый способ сделать это, и можете ли вы привести пример?