Я экспортировал несколько писем MS-Outlook в текстовый файл.Сейчас я пытаюсь найти некоторые конкретные строки в этом текстовом файле, но, похоже, это не работает:
Prompt>/C/Temp_Folder$ egrep "Found crash|process disappearance " testtttt.txt | wc -l
13
Prompt>/C/Temp_Folder$ grep "Found crash" testtttt.txt | wc -l
11
Prompt>/C/Temp_Folder$ grep "process disappearance " testtttt.txt | wc -l
3
Открывая этот файл в Notepad ++, я получаю следующие результаты:
Found crash : 921 matches
process disappearance : 4975 matches
Это может быть интересно:
Когда я запускаю grep
без wc -l
, в конце я вижу следующий результат:
Binary file testtttt.txt matches
Это, вероятно, означает, что файл обрабатывается как двоичный файлфайл, хотя это просто «обычный» текстовый файл.
Когда я спрашиваю, с каким типом файла я имею дело, я получаю следующий результат:
file testtttt.txt
testtttt.txt: news or mail, ISO-8859 text, with very long lines, with CRLF line terminators
Что здесь происходит:это news or mail
, ISO-8859
, very long lines
, ..., и как я могу это решить?
Для вашего понимания я работаю над подсистемой Linux на Windows-10машина (приложение Ubuntu от Canonical Group Limited
).