Предустановленная кодировка для функции поиска в файлах - PullRequest
0 голосов
/ 15 октября 2019

У меня есть огромная Filedump для обработки (более 7000 файлов), которые все закодированы в OEM-US (и мне нужно, чтобы они оставались OEM-US или возвращались в OEM-US, когда я закончу)

Функция поиска в файлах из Notepad ++ фактически решит все мои проблемы. (Это одноразовое задание - я не хочу утомлять вас деталями, но речь идет о санации старого кода, который частично написан на иностранных языках, таких как немецкий или французский, включая их пресловутые символы, такие как äöüèéàç)

Дело в том, что в большинстве случаев Notepad ++ обнаруживает неправильные кодировки и разные кодировки для разных файлов. Обычно он обнаруживает ANSI или UTF-8, но иногда это становится экзотическим, и внезапно мои файлы должны быть закодированы в Shift-JIS или Big5, что портит мои поисковые термины, поскольку они иногда превращают разные специальные символы в один и тот же набор символов. замена символов.

Так что я ищу способ либо

a) Скажите notepad ++, какую кодировку выбрать для задания "поиск в файлах", которое я хочу запустить.

b) преобразовать все файлы в UTF-8, выполнить там задание поиска-замены и восстановить кодировку OEM-US

или

c) Найти другое программное обеспечение для решения этой проблемыдля меня

Может ли кто-нибудь мне помочь?

...