Удаление нежелательных персонажей из Ruby String - PullRequest
1 голос
/ 10 июня 2009

Я пытаюсь очистить строку, полученную с веб-сайта, с помощью механизации

здесь исключение из строки с символами барахла

"Mountain</b></a><br>ΓÇÄ1hr&nbsp;39minΓÇÄΓÇÄ - Rated&nbsp;PGΓÇÄΓÇÄ - Action/Adventure/Science&nbsp;fictionΓÇÄΓÇÄ - EnglishΓÇÄ - <a href="

Кто-нибудь знает, откуда берутся символы и как я могу заменить их пробелами? Как ruby ​​справляется с кодировкой символов?

1 Ответ

3 голосов
/ 10 июня 2009

Эти символы выглядят так, как будто они появляются в результате проблемы с кодировкой UTF-8. Я рекомендую прочитать отличную статью Джоэла Абсолютный минимум для каждого разработчика программного обеспечения. Абсолютно, положительно необходимо знать о Unicode и наборах символов (без оправданий!) , в которых объясняется кодировка UTF-8 и как с ней обращаться в вашем коде.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...