До сих пор я не выяснил, как определить интервал как таковой, но я все еще думаю, что нашел проблему, почему пространство было слишком большим.
Я добавляю утверждение
puts content.dump
в мой класс для печати содержимого на консоли.
В тех случаях, когда у меня был абзац в содержимом, этот абзац заменяли на \ n \ n.Пример:
<p>Text</p><p>Text</p>
заменен на
"Text\n\nText\n\n"
Поскольку я в любом случае использую метод html sanitizer для удаления нежелательных тегов html, я мог бы расширить метод следующим образом:
res = content.gsub(/\n{2,2}/, "\n")
res = res.gsub(/\n{3,}/, "\n\n")
Это решило проблему для меня.