Я импортирую файл CSV в Ruby (1.8.7).File.open ('path / to / file.csv'). Read возвращает это в консоли:
Stefan,Engstr\232m
Кодировка определяется как iso-8859-2 UniversalDetector (chardet gem).
UniversalDetector::chardet("Stefan,Engstr\232m")
=> {"confidence"=>0.626936305574385, "encoding"=>"ISO-8859-2"}
Попытка преобразования строки приводит к следующему:
Iconv.conv("UTF-8", "ISO-8859-2", "Stefan,Engstr\232m")
=> "Stefan,Engstrm"
, тогда как я ожидаю:
=> "Stefan,Engström"
- Может ли строка действительно быть в каком-то другомкодировка?
- Раньше я не видел синтаксиса \ 232, обычно, когда строки странно кодируются, вместо них появляется какой-то странный символ, например, � или какой-то китайский.* Дайте мне знать, если я предоставлю больше информации или уточню что-нибудь.