У меня большой текстовый файл, который содержит несколько последовательных JSON объектов. Насколько я могу судить, лучший способ индивидуальной интерпретации / загрузки объектов JSON состоит в том, чтобы взять их из текстового файла и поместить их в отдельные строки, чтобы я мог перебирать их построчно.
К сожалению, мне не удалось заставить python разделить их на отдельные строки без структуры JSON, которая была бы разрушена до нечеткости. Кроме того, эти файлы довольно большие и содержат много информации. Пожалуйста, дайте мне знать, как лучше всего: а) получить разные JSON строки объектов на разные строки в пределах python, или б) лучший способ индивидуального анализа информации.
Вот как выглядит текст как в файлах:
"{\"time\":\"Fri Aug 09 18:55:37 +0000 2019\", \"id\":720,\"text\":\"I'd really like to find a good solution to this problem.\",\"source\":\"href=\\\"http:\\/\\/stackoverflow.com\\\",\"lang\":\"en\",\"timestamp_ms\":\"1565376937344\"}\r\n""{\"time\":\"Sat Aug 10 22:16:00 +0000 2019\", \"id\":721,\"text\":\"And I would appreciate your help!\",\"source\":\"href=\\\"http:\\/\\/stackoverflow.com\\\",\"lang\":\"en\",\"timestamp_ms\":\"156534564531\"}\r\n""{\"time\":\"Sun Aug 09 18:55:37 +0000 2019\", \"id\":720,\"text\":\"Imagine additional text repeating below.\",\"source\":\"href=\\\"http:\\/\\/stackoverflow.com\\\",\"lang\":\"en\",\"timestamp_ms\":\"1565376937344\"}\r\n"
Если вы назначите вышеуказанный текст объекту python и попросите python напечатать его, python вернет то, что я хочу увидеть , т.е.:
{"time":"Fri Aug 09 18:55:37 +0000 2019", "id":720,"text":"I'd really like to find a good solution to this problem.","source":"href=\"http:\/\/stackoverflow.com\","lang":"en","timestamp_ms":"1565376937344"}
{"time":"Sat Aug 10 22:16:00 +0000 2019", "id":721,"text":"And I would appreciate your help!","source":"href=\"http:\/\/stackoverflow.com\","lang":"en","timestamp_ms":"156534564531"}
{"time":"Sun Aug 09 18:55:37 +0000 2019", "id":720,"text":"Imagine additional text repeating below.","source":"href=\"http:\/\/stackoverflow.com\","lang":"en","timestamp_ms":"1565376937344"}
Но если я прочту файл в python объект и напечатаю этот объект, я получаю оригинальный текст. Я попытался f.read()
, readline()
, readlines()
, splitlines()
(что дало мне беспорядочный дополнительный беспорядок \\ s), и я попытался разбить строку, используя splitstring()
. Я очень в растерянности, и я признаю, что я довольно плохо знаком с программированием и никогда не садился изучать основы.
Любая помощь, которую вы можете дать мне, чтобы взять приведенный выше текст и, в конечном счете, сможет перевести их в отдельный JSON объект и прочитать, скажем, тексты из каждого из них. Моя конечная цель - иметь возможность вызывать словарные ключи из отдельных json объектов, например:
for line in f:
data = json.loads(line)
print(data[‘text’])
и получать следующий список
"I'd really like to find a good solution to this problem."
"And I would appreciate your help!"
"Imagine additional text repeating below."