Текстовый файл обрабатывается как двоичный файл - PullRequest
0 голосов
/ 15 сентября 2011

У меня есть скрипт, который выводит взаимодействия с базой данных.В QA один из запросов, пойманных моим сценарием, оказался чудовищной огромной вещью (более 200 000 символов), сильно нагруженной (я уверен, что это) символами UTF-8.(По крайней мере, происходит много escape-backslash.)

Проблема в том, что когда один из текстовых файлов, где появляется этот запрос, открывается текстовым редактором, редактор настаиваетобрабатывать его как двоичный файл.Это происходит как в Linux (Kate), так и в Windows (Notepad, Wordpad).Могу ли я что-нибудь сделать с файлом, чтобы он воспринимался как текстовый файл, а не как двоичный файл?


РЕДАКТИРОВАТЬ: Разность потенциалов.Текстовые файлы, которые обрабатываются должным образом, создаются файловым вводом-выводом Perl, тогда как файл, который портит Кейт и друзей, создается простым перенаправлением «./my_script.pl> output.log».Может ли это быть источником моей проблемы?

Ответы [ 2 ]

0 голосов
/ 15 сентября 2011

В Windows я действительно рекомендую Блокнот ++ - доступен также как portable - он очень хорошо обрабатывает большие файлы, даже не пытайтесь открыть большой файл во встроенной WindowsБлокнот;)

Но я не знаю, может ли это помочь в вашем деле.

0 голосов
/ 15 сентября 2011

Вы пробовали редактор типа emacs или vim?Оба имеют поддержку UTF-8. Kate также позволяет установить кодировку (пункт меню инструментов / encoding / unicode).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...