Я использую Nokogiri для разбора HTML-страницы, но у меня странные проблемы с неразрывными пробелами. Я пробовал разные кодировки, заменяя пробелы и несколько других попыток вызвать головную боль.
Вот фрагмент HTML-кода, о котором идет речь:
<td>Amount 15,300 at dollars</td>
Обратите внимание на изменение для
представления после того, как я использую Nokogiri:
<td>Amount 15,300 at dollars</td>
И вывод inner_text
:
Amount 15,300 at dollars
Это мой базовый захват Нокогири, я попытался найти несколько альтернатив, но с треском провалился:
doc = Nokogiri::HTML(open(url))
А затем я делаю doc.search
для рассматриваемого предмета.
Обратите внимание, что если я посмотрю на документ, появится строка с  
на этой строке.
Разъяснение: я не думаю, что я четко изложил трудности, с которыми я сталкиваюсь. Я не могу заставить inner_text
появляться без странного символа Â
.