Я анализирую этот канал http://www.sixapart.com/labs/update/developers/ с помощью nokogiri, а затем запускаю регулярное выражение для содержимого некоторых тегов.Контент в основном UTF-8, но иногда он поврежден.Тем не менее, для моего случая мне все равно, и мне просто нужно пропустить нужные части контента, поэтому я с радостью воспринимаю данные как двоичные / ASCII-8BIT.Проблема в том, что независимо от того, что я делаю, регулярные выражения в моем сценарии рассматриваются как UTF-8 или ASCII.Независимо от того, на что я установил комментарий кодировки или что я делаю для создания регулярного выражения.
Есть ли решение для этого?Могу ли я заставить регулярное выражение в двоичном виде?Можно ли легко сделать gsub без регулярных выражений?(Я просто заменяю & на &)