Я читаю о том, как ленивые последовательности могут вызывать OutOfMemoryError при использовании, скажем, loop / recur на больших последовательностях.Я пытаюсь загрузить файл 3MB из памяти, чтобы обработать его, и я думаю, что это происходит со мной.Но я не знаю, есть ли идиоматический способ исправить это.Я пытался вставить doall's, но тогда моя программа, похоже, не заканчивалась.Малые входные данные работают:
Малые входные данные (содержимое файла): AAABBBCCC Правильный вывод: ((65 65) (65 66) (66 66) (67 67) (67 67))
Код:
(def file-path "/Users/me/Desktop/temp/bob.txt")
;(def file-path "/Users/me/Downloads/3MB_song.m4a")
(def group-by-twos
(fn [a-list]
(let [first-two (fn [a-list] (list (take 2 a-list)))
the-rest-after-two (fn [a-list] (rest (rest a-list)))
only-two-left? (fn [a-list] (if (= (count a-list) 2) true false))]
(loop [result '() rest-of-list a-list]
(if (nil? rest-of-list)
result
(if (only-two-left? rest-of-list)
(concat result (list rest-of-list))
(recur (concat result (first-two rest-of-list))
(the-rest-after-two rest-of-list))))))))
(def get-the-file
(fn [file-name-and-path]
(let [the-file-pointer
(new java.io.RandomAccessFile (new java.io.File file-name-and-path) "r")
intermediate-array (byte-array (.length the-file-pointer))] ;reserve space for final length
(.readFully the-file-pointer intermediate-array)
(group-by-twos (seq intermediate-array)))))
(get-the-file file-path)
Как я сказал выше, когда я ставил в кучу мест, это, казалось, не закончилось.Как я могу заставить это работать для больших файлов, и есть ли способ избавиться от когнитивного бремени делать то, что мне нужно делать?Какое-то правило?