Question

У меня есть страница, на которой будут перечислены новостные статьи. Чтобы сократить длину страницы, я только хочу отобразить тизер (первые 200 слов / 600 букв статьи), а затем отобразить ссылку «еще ...», которая при щелчке развернет остальную часть статья в стиле jQuery / Javascript. Теперь я все это выяснил и даже нашел следующий вспомогательный метод на некоторой странице вставки, который будет следить за тем, чтобы новостная статья (строка) не была выделена прямо в середине слова:

 def shorten (string, count = 30)
    if string.length >= count
      shortened = string[0, count]
      splitted = shortened.split(/\s/)
      words = splitted.length
      splitted[0, words-1].join(" ") + ' ...'
    else
      string
    end
  end

Проблема, с которой я столкнулся, заключается в том, что тела новостных статей, которые я получаю из БД, имеют формат HTML. Так что, если мне не повезет, вышеупомянутый помощник порежет строку моей статьи прямо в середине html-тега и вставит туда строку "more ..." (например, между ""), что повредит мой html на странице. .

Есть ли способ обойти это или есть плагин, который я могу использовать для генерации отрывков / тизеров из строки HTML?

mwilliams · Answer 1 · 11 февраля 2009

Вы можете использовать комбинацию Обеззараживание и Усечение .

truncate("And they found that many people were sleeping better.", 
  :omission => "... (continued)", :length => 15)
# => And they found... (continued)

Я выполняю аналогичную задачу, где у меня есть записи в блоге, и я просто хочу показать краткий отрывок. Так что, на мой взгляд, я просто делаю:

sanitize(truncate(blog_post.body, length: 150))

Он удаляет теги HTML, дает мне первые 150 символов и обрабатывается в представлении, что делает его удобным для MVC.

Удачи!

dbr · Answer 2 · 11 февраля 2009

Мой ответ здесь должен работать. Первоначальный вопрос (ошибочно заданный мной) касался усечения уценки, но в итоге я преобразовал уценку в HTML, а затем урезал ее, чтобы она работала.

Конечно, если ваш сайт получает много трафика, вы должны кэшировать выдержку (возможно, когда пост создается / обновляется, вы можете сохранить выдержку в базе данных?), Это также означает, что вы можете позволить пользователю изменить или введите собственный отрывок

Использование:

>> puts "<p><b><a href=\"hi\">Something</a></p>".truncate_html(5, at_end = "...")
=> <p><b><a href="hi">Someth...</a></b></p>

.. и код (скопированный из другого ответа):

require 'rexml/parsers/pullparser'

class String
  def truncate_html(len = 30, at_end = nil)
    p = REXML::Parsers::PullParser.new(self)
    tags = []
    new_len = len
    results = ''
    while p.has_next? && new_len > 0
      p_e = p.pull
      case p_e.event_type
      when :start_element
        tags.push p_e[0]
        results << "<#{tags.last}#{attrs_to_s(p_e[1])}>"
      when :end_element
        results << "</#{tags.pop}>"
      when :text
        results << p_e[0][0..new_len]
        new_len -= p_e[0].length
      else
        results << "<!-- #{p_e.inspect} -->"
      end
    end
    if at_end
      results << "..."
    end
    tags.reverse.each do |tag|
      results << "</#{tag}>"
    end
    results
  end

  private

  def attrs_to_s(attrs)
    if attrs.empty?
      ''
    else
      ' ' + attrs.to_a.map { |attr| %{#{attr[0]}="#{attr[1]}"} }.join(' ')
    end
  end
end

Sebastian · Answer 3 · 11 февраля 2009

Большое спасибо за ваши ответы! Однако в то же время я наткнулся на плагин jQuery HTML Truncator *1002*, который идеально подходит для моих целей и переносит усечение на клиентскую сторону. Легче не становится: -)

August Lilleaas · Answer 4 · 12 февраля 2009

Я бы санировал HTML и извлекал первое предложение. Предполагая, что у вас есть модель статьи с атрибутом body, содержащим HTML:

# lib/core_ext/string.rb
class String
  def first_sentence
    self[/(\A[^.|!|?]+)/, 1]
  end
end

# app/models/article.rb
def teaser
  HTML::FullSanitizer.new.sanitize(body).first_sentence
end

Это конвертирует " Эта является важной статьей! А вот и остальная часть статьи" в «Это важная статья».

LDomagala · Answer 5 · 11 февраля 2009

вам придется написать более сложные парсеры, если вы не хотите разбивать середину HTML-элементов. он должен будет запомнить, находится ли он в середине блока <> и находится ли он между двумя тегами.

, даже если бы вы сделали это, у вас все равно были бы проблемы. если некоторые помещают всю статью в html-элемент, так как парсер не может разбить ее где-либо из-за отсутствующего закрывающего тега.

если это вообще возможно, я бы постарался не вставлять в статьи какие-либо теги или оставлять их в тегах, которые ничего не содержат (нет <div> и т. Д.). таким образом, вам нужно будет только проверить, что вы находитесь в середине тега, который довольно прост:

  def shorten (string, count = 30)
     if string.length >= count
       shortened = string[0, count]
       splitted = shortened.split(/\s/)
       words = splitted.length
       if(splitted[words-1].include? "<")
         splitted[0,words-2].join(" ") + ' ...'
       else
         splitted[0, words-1].join(" ") + ' ...'
     else
       string
     end   
  end

boulder · Answer 6 · 29 марта 2014

Теперь есть гем с именем HTMLTruncator , который позаботится об этом за вас. Я использовал его для отображения выдержек из постов и тому подобного, и это очень надежно.

StarWars · Answer 7 · 28 сентября 2013

Я решил это, используя следующее решение

Установить гем 'sanitize'

gem install sanitize

и использовал следующий код, здесь body - это текст, содержащий HTML-теги.

<%= content_tag :div, Sanitize.clean(truncate(body, length: 200, separator: ' ', omission: "... #{ link_to '(continue)', '#' }"), Sanitize::Config::BASIC).html_safe %>

Дает выдержку с верным html. Надеюсь, это кому-нибудь поможет.

рельсы: получить тизер / выдержку для статьи

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 7 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

рельсы: получить тизер / выдержку для статьи

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 7 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы