Ошибка переполнения при чтении файла JSON - PullRequest
0 голосов
/ 06 июля 2018

Я пытаюсь прочитать json, который содержит несколько твитов, но я получаю следующую ошибку.

OverflowError: int слишком велик для преобразования

Сценарий фильтрует несколько файлов JSON, чтобы получить определенные твиты, и падает при достижении определенного JSON.

Вот строка, которая создает ошибку:

df_temp = pd.read_json(path_or_buf=json_path, lines=True)

Вот ошибка в cmd

1 Ответ

0 голосов
/ 06 июля 2018

Просто сохраните идентификатор пользователя как строку и рассматривайте его как единое целое (это именно то, что вы должны делать при работе с идентификаторами такого типа). Если вы не можете изменить формат ввода json, вы всегда можете разобрать его как строку, прежде чем анализировать как объект json, и добавить кавычки в код id, используя, например, регулярные выражения: Regex в python .

Я не знаю, с какой библиотекой вы анализируете json, но, возможно, подойдет и неявное приведение: либо попробуйте метод getString для числа вместо метода getInt, либо заставьте python обработать объект как строка, с чем-то вроде x = "" + json.getId()

Python довольно свободно печатает и может позволить вам это сделать.

...