Я разрабатывал синтаксический анализатор , который принимает JavaScript в качестве ввода и создает сжатую версию этого JavaScript в качестве вывода.
Сначала я обнаружил, что синтаксический анализатор не смог прочитать входной JavaScript. Я считаю, что это как-то связано с тем, что Visual Studio 2008 сохраняет свои файлы по умолчанию как UTF-8 . И при этом VS включает в себя пару скрытых символов в начале файла UTF-8 .
В качестве обходного пути я использовал Visual Studio для сохранения файла как кодовая страница 1252 . После этого мой парсер смог прочитать входной JavaScript.
Обратите внимание, что мне нужно использовать специальные европейские символы с акцентами.
Итак, вот мои вопросы:
- Должен ли я использовать кодовую страницу 1252 или UTF-8?
- Почему Visual Studio по умолчанию сохраняет файлы в формате UTF-8?
- Если я выберу сохранение файлов как 1252, это приведет к проблемам?
- Мне кажется, что Eclipse сохраняет файлы как кодовую страницу 1252 по умолчанию. Это звучит правильно?