Как преобразовать файл JSON в CSV с 15 000 твитов, используя Python 3 - PullRequest
0 голосов
/ 10 ноября 2019

введите описание изображения здесь Я собрал 15 000 арабских твитов для исследовательских целей с использованием API твипового стримера. твиты были сохранены в 37 файлах JSON и, наконец, скопированы в один файл JSON. Я пытаюсь преобразовать его в CSV с помощью этого сценария: https://github.com/HMukdadi/json-csv-converter, но я продолжаю получать
"Ошибка загрузки файла ... выход: Дополнительные данные: строка 3, столбец 1 (символ 7478)"
Кроме того, я лингвист, и у меня нет твердого опыта программирования:).

https://i.stack.imgur.com/k270b.png

1 Ответ

0 голосов
/ 10 ноября 2019

Это нормально, потому что файл json содержит много объектов json, которые должны быть в массиве JSON или в родительском объекте json.

Если хотите, разместите 2 или 3 строки, и я напишу для вас скрипт, которыйпримите ваш тип ввода или: добавьте [в начале] в конце и, после каждого}, кроме последнего, и скрипт будет работать для вас

Этот скрипт преобразует ваш json-файл, похожий на образец, вдопустимый массив json, который будет работать со сценарием в репозитории git (протестировано)

import sys

print("[")
with open(sys.argv[1]) as files:
    lines=files.readlines()
    for line in lines:
        if(line!="\n"):

            print(line)
        else:
            print(",")
    files.close()
print("]")

выполнить его: python3 file.py [yourJsonFile] >> newJsonFile.json

, а затем выполнить json-csv-converter.py с newJsonFile.json

enter image description here

Предположим, у вас есть файл SAMPLE.json: enter image description here

Просто выполнитескрипт:

enter image description here

Затем выполните json-csv-converter.py:

enter image description here

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...