Как решить Суррогатную ошибку синтаксического анализа при запуске кода JQ для извлечения данных из файлов JSON - PullRequest
0 голосов
/ 24 апреля 2019

У меня есть один файл json (fullscan_record.json), в котором хранятся данные почти за 5 лет (заголовок, html, продукт, данные, метка времени, ip, порт и т. Д.), Связанные с баннером http.Сейчас я пытаюсь извлечь информацию для отметки времени = 3 месяца (с августа 2018 по октябрь 2018).Данные должны быть сохранены в новом файле т.е. (extract_3months.json)

Но во время выполнения кода, указанного ниже:

jq '.|выберите ((.timestamp> = "2018-08-01T00: 00: 00.000000") и (.timestamp <"2018-11-01T00: 00: 00.000000")) 'fullscan_record.json> extract_3months.json

Я получаю сообщение об ошибке:

"Ошибка разбора: неверный выход суррогатной пары \ uXXXX \ uXXXX в строке 3679, столбец 1919"

Я не знаком с суррогатом и UTF, так как я новичокв этой области.

Фактический результат:

Ошибка разбора: Недопустимый выход суррогатной пары \ uXXXX \ uXXXX в строке 3679, столбец 1919

Ожидаемый результат:

Мне нужно получить обычный вывод.

...