Оптимизация Ruby RSS - PullRequest
       0

Оптимизация Ruby RSS

0 голосов
/ 03 июня 2011

Я пишу очень простой скрипт на Ruby для разбора твитов из твиттера RSS.Вот код, который у меня есть:

require 'rss'
@rss = RSS::Parser.parse('statuses.xml', false)
outputfile = open("output.txt", "w")
@rss.items.each do |i|
  pubdate = i.published.to_s
  if pubdate.include? '2011-05'
    tweet = i.title.to_s
    tweet = tweet.gsub(/<title>SlyFlourish: /, "")
    tweet = tweet.gsub(/<\/title>/, "\n\n")
    outputfile << tweet
  end
end

Я думаю, что мне чего-то не хватает в работе с объектами, выходящими из парсера RSS.Может кто-нибудь сказать мне, как я могу лучше извлечь заголовок и дату из объекта, возвращаемого анализатором?

1 Ответ

0 голосов
/ 03 июня 2011

Есть ли причина, по которой вы выбрали RSS? Синтаксический анализ XML стоит дорого.

Я бы хотел вместо этого использовать JSON.

Также есть твиттер Ruby gem, который делает это действительно простым:

require "twitter"
Twitter.user_timeline("gavin_morrice").each do |tweet|
  puts tweet.text
  puts tweet.created_at
end
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...