Использование Ruby для поиска общих строк в файлах X - PullRequest
3 голосов
/ 04 августа 2010

Сейчас у меня есть 3 файла, но я бы хотел сделать это так, чтобы я мог добавить их позже. Каждый файл представляет собой список идентификаторов, например:

174535945 174538045 160515924 81712260 25241494

Я бы хотел, чтобы на выходе были элементы, которые появляются в списке 1 и списке 2, списке 2 и списке 3, и те, которые появляются в списке 1 и списке 2 и списке 3.

Будет ли самый рубиновый способ создать хеш с ключом для каждого списка, а затем получить все ключи и проверить все хэши, или есть хороший драгоценный камень, который поможет с этим?

Спасибо

Ответы [ 2 ]

4 голосов
/ 04 августа 2010

Используйте наборы:

require 'set'

list_1 = open(filename_1).read.split.to_set
list_2 = open(filename_2).read.split.to_set
list_3 = open(filename_3).read.split.to_set

puts list_1 & list_2
puts list_2 & list_3
puts list_1 & list_2 & list_3
0 голосов
/ 04 августа 2010

Я думаю, что ваше предложение использовать хэш - это путь:

require 'set'

class Test
  def initialize()
    @lists = {174=>[1,2,3], 111=>[2,3,4], 160=>[2,4,5]}
  end

  def common_members(*keys)
    lists_as_sets = {}
    @lists.each_pair {|key,list| lists_as_sets[key] = list.to_set}
    common = lists_as_sets[keys.shift] # Set to key[0] and nil that element of keys
    keys.each {|k| common = common & lists_as_sets[k]} # Intersect the remaining keys, if any
    common.to_a
  end
end

t = Test.new
p t.common_members(174,111) # => [2,3]
p t.common_members(111,160) # => [2,4]
p t.common_members(174,111,160) # =>[2]
...