Хотя вы не сказали, как «пропустили» строку, я могу рассказать вам, что произошло.
Символ é
имеет кодовую точку E9. В UTF-8 это кодируется как два байта: C3 A9. Таким образом, правильный способ показать "scénario" в URL-адресе -
sc%C3%A9nario
Теперь, что произойдет, если вы возьмете эту строку и посмотрите на каждый отдельный байт и предположите, что они являются символами, и сделали кодировку UTF-8 во второй раз ? Что случилось бы это
- с -> с
- с -> с
- % C3 будет интерпретироваться как символ с кодовой точкой C3, а именно Ã, который в UTF-8 равен C3 83.
- % A9 будет интерпретироваться как символ с кодовой точкой A9, а именно ©, который в UTF-8 является C2 A9.
- n -> n
Это в точности соответствует тому, что вы видели в IE.
Теперь я не могу точно сказать, как это произошло, потому что в вопросе не было достаточного фона, но ясно, что каким-то образом строка «scénario» была закодирована в строку байтов UTF-8 затем он был закодирован снова на основании странного предположения, что первая кодировка вызвала строку символов в кодировке Windows-1252 или Latin-1.
Вам нужно посмотреть, как ваша строка "кодировалась дважды".