Начинающий с Ruby здесь.
У меня есть два текстовых файла, FILE1.txt и FILE2.txt (3 ГБ). Я пытаюсь взять каждое из имен регистров из FILE1.txt, чтобы найти ключевые слова, которые похожи на FILE2.txt, поскольку он содержит пути к нужным мне регистрам.
Например:
FILE1.txt:
STRING_THAT_MATCHES_FILE1
STRING_THAT_DOES_NOT_MATCH
STRING_THAT_DOES_NOT_MATCH_2
3 ГБ текста FILE2.txt:
SYS.abcd.abcd.abcd.STRING_THAT_MATCHES_FILE1 6067d88dh
SYS.efgh.ijkl.abcd.doesnt_match 0h
Когда я пытаюсь сравнить файлы, такие как следующий код, я получаю пустой массив
$: << File.join( File.dirname(__FILE__), 'Ruby' )
require 'csv'
require 'etc'
require 'timeout'
require 'date'
require 'set'
paths_file = 'FILE2.txt'
register_file = 'FILE1.txt'
register_array = Array.new
paths_array = Array.new
compared = Array.new
File.foreach(register_file).with_index do |regs|
register_array << regs
File.foreach(paths_file).with_index do |paths|
paths_array << paths
if regs.include? paths
compared << paths
print compared
end
end
end
Это вывод, который я получаю:
["\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n"]