Идиоматическое закрытие для отчетов о проделанной работе? - PullRequest
33 голосов
/ 07 января 2010

Как я должен следить за прогрессом отображенной функции в clojure?

При обработке записей на императивном языке я часто печатаю сообщение, чтобы указать, как далеко зашло дело, например, отчетность каждые 1000 записей. По сути это подсчет повторений цикла.

Мне было интересно, какие подходы я мог бы применить к этому в ближайшем будущем, когда я сопоставляю функцию для моей последовательности записей. В этом случае печать сообщения (и даже ведение учета прогресса), по-видимому, является по существу побочными эффектами.

То, что я придумала до сих пор, выглядит так:

(defn report
  [report-every val cnt]
  (if (= 0 (mod cnt report-every))
    (println "Done" cnt))
    val)

(defn report-progress
  [report-every aseq]
  (map (fn [val cnt] 
          (report report-every val cnt)) 
       aseq 
       (iterate inc 1)))

Например:

user> (doall (report-progress 2 (range 10)))
Done 2
Done 4
Done 6
Done 8
Done 10
(0 1 2 3 4 5 6 7 8 9)

Существуют ли другие (лучшие) способы достижения этого эффекта?

Есть ли подводные камни в том, что я делаю? (Я думаю, что я сохраняю лень и не держу голову, например.)

Ответы [ 4 ]

32 голосов
/ 07 января 2010

Отличительной особенностью clojure является то, что вы можете прикреплять отчеты к самим данным вместо кода, который выполняет вычисления. Это позволяет вам отделить эти логически разные части. Вот фрагмент из моего misc.clj, который я использую почти во всех проектах:

(defn seq-counter 
  "calls callback after every n'th entry in sequence is evaluated. 
  Optionally takes another callback to call once the seq is fully evaluated."
  ([sequence n callback]
     (map #(do (if (= (rem %1 n) 0) (callback)) %2) (iterate inc 1) sequence))
  ([sequence n callback finished-callback]
     (drop-last (lazy-cat (seq-counter sequence n callback) 
                  (lazy-seq (cons (finished-callback) ())))))) 

затем оберните репортера вокруг ваших данных и затем передайте результат в функцию обработки.

(map process-data (seq-counter inc-progress input))
6 голосов
/ 08 января 2010

Я бы, вероятно, выполнил отчетность в агенте. Примерно так:

(defn report [a]
  (println "Done " s)
  (+ 1 s))

(let [reports (agent 0)]
  (map #(do (send reports report)
            (process-data %))
       data-to-process)
4 голосов
/ 07 января 2010

Я не знаю ни одного из существующих способов сделать это, возможно, было бы неплохо просмотреть документацию clojure.contrib, чтобы посмотреть, есть ли уже что-то. А пока я посмотрел на ваш пример и немного прояснил его.

(defn report [cnt]
  (when (even? cnt)
    (println "Done" cnt)))

(defn report-progress []
  (let [aseq (range 10)]
    (doall (map report (take (count aseq) (iterate inc 1))))
    aseq))

Вы движетесь в правильном направлении, хотя этот пример слишком прост. Это дало мне представление о более обобщенной версии вашей функции выполнения отчетов. Эта функция будет принимать функцию, подобную карте, отображаемую функцию, функцию отчета и набор коллекций (или начальное значение и коллекцию для тестирования).

(defn report-progress [m f r & colls]
  (let [result (apply m
                 (fn [& args]
                   (let [v (apply f args)]
                     (apply r v args) v))
                 colls)]
    (if (seq? result)
      (doall result)
      result)))

Секв? часть есть только для использования с уменьшением, которое не обязательно возвращает последовательность. С помощью этой функции мы можем переписать ваш Пример как это:

user> 
(report-progress
  map
  (fn [_ v] v)
  (fn [result cnt _]
    (when (even? cnt)
      (println "Done" cnt)))
  (iterate inc 1)
  (range 10))

Done 2
Done 4
Done 6
Done 8
Done 10
(0 1 2 3 4 5 6 7 8 9)

Проверка функции фильтра:

user> 
(report-progress
  filter
  odd?
  (fn [result cnt]
    (when (even? cnt)
      (println "Done" cnt)))
  (range 10))

Done 0
Done 2
Done 4
Done 6
Done 8
(1 3 5 7 9)

И даже функция уменьшения:

user> 
(report-progress
  reduce
  +
  (fn [result s v]
    (when (even? s)
      (println "Done" s)))
  2
  (repeat 10 1))

Done 2
Done 4
Done 6
Done 8
Done 10
12
0 голосов
/ 05 октября 2016

У меня была эта проблема с некоторыми медленно работающими приложениями (например, база данных ETL и т. Д.). Я решил это, добавив функцию (tupelo.misc/dot ...) в библиотеку tupelo . Пример:

(ns xxx.core 
  (:require [tupelo.misc :as tm]))

(tm/dots-config! {:decimation 10} )
(tm/with-dots
  (doseq [ii (range 2345)]
    (tm/dot)
    (Thread/sleep 5)))

Выход:

     0 ....................................................................................................
  1000 ....................................................................................................
  2000 ...................................
  2345 total

Документы API для пространства имен tupelo.misc можно найти здесь .

...