Python - данные твитов (Json): как отфильтровать битые твиты?(строка не в формате JSON) - PullRequest
0 голосов
/ 29 сентября 2018

Я выполняю задание по загрузке данных твита (JSON) в Python.Одна из задач состоит в том, чтобы отфильтровать сломанный твит (строка не в формате JSON)

Мой первый код:

with open('./hw2-files-10mb.txt') as json_file:
data =json.load(json_file)

Output: JSONDecodeError: Extra data: line 2 column 1 (char 3979)

Я добавляю в попытке / кроме, и что я хочуЗапрограммировать, если строка не в формате JSON, пропустить ее и перейти к загрузке следующей строки.

with open('./hw2-files-10mb.txt') as json_file:
lines = json_file.readlines()
for line in lines:
    try: 
        data =json.load(json_file)
    except ValueError:
        pass

Однако мой вывод - только один твит.Кажется, что код перестает работать при возникновении ошибки.Пожалуйста, порекомендуйте.Спасибо и хороших выходных.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...