У меня есть куча больших файлов JSON (> 500 МБ), которые я хотел бы проанализировать с помощью скрипта ruby (я пытаюсь. Проанализировать его с помощью гема YAJL).
Я заметил, что файлы JSON имеют ошибки форматирования, так что все файлы состоят из «нескольких» объектов JSON без правильной древовидной структуры или массива. Ниже вы можете найти, как выглядит файл JSON:
testfile.json:
{title: "Don Quixote", author: "Miguel de Cervantes", printyear: 2010}
{title: "Great Gatsby", author: "F. Scott Fitzgerald", printyear: 2014}
{title: "Ulysses", author: "James Joyce", printyear: 2010}
Это скрипт для разбора файла:
require 'yajl'
json = File.new('testfile.json', 'r')
hash = Yajl::Parser.parse(json)
Вот сообщение об ошибке, которое я получаю:
Yajl::ParseError: Found multiple JSON objects in the stream but no block or the on_parse_complete callback was assigned to handle them.
Буду признателен, если вы поможете мне решить эту проблему.