Отслеживание юникодных слов из Twitter с использованием Ruby и API Tweetstream - PullRequest
1 голос
/ 12 июня 2010

Я пытаюсь отследить набор ключевых слов из Twitter с помощью API потоковой передачи (здесь невозможно опубликовать ссылку из-за ограничений на спам: Google Streaming API).

Я делаю это внутри Ruby, используя TweetStream gem

Проблема, с которой я столкнулся, заключается в том, что я хочу отслеживать ключевые слова, которые содержат символы Unicode / UTF-8.Например:

require 'rubygems'
require 'tweetstream'
TweetStream::Client.new("my_user_name", "my_password").track("é") do |s|
 puts s.text
end

(вы можете попробовать его, если вы установили самоцветы tweetstream и json)

Этот фрагмент кода ничего не печатает, заменяя «é» на «e "выводит кучу твитов непрерывно.

Я не нашел надежной документации по Unicode в Ruby, поэтому не знаю, откуда возникла проблема.

1 Ответ

0 голосов
/ 12 июня 2010

Хорошую часть ответа можно найти здесь: http://groups.google.com/group/twitter4j/browse_thread/thread/49515c9d1b90fa47?pli=1

Вкратце: потоковое вещание Twitter не поддерживает отслеживание символов UTF-8.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...