Question

У меня большой текстовый файл, который содержит несколько последовательных JSON объектов. Насколько я могу судить, лучший способ индивидуальной интерпретации / загрузки объектов JSON состоит в том, чтобы взять их из текстового файла и поместить их в отдельные строки, чтобы я мог перебирать их построчно.

К сожалению, мне не удалось заставить python разделить их на отдельные строки без структуры JSON, которая была бы разрушена до нечеткости. Кроме того, эти файлы довольно большие и содержат много информации. Пожалуйста, дайте мне знать, как лучше всего: а) получить разные JSON строки объектов на разные строки в пределах python, или б) лучший способ индивидуального анализа информации.

Вот как выглядит текст как в файлах:

"{\"time\":\"Fri Aug 09 18:55:37 +0000 2019\", \"id\":720,\"text\":\"I'd really like to find a good solution to this problem.\",\"source\":\"href=\\\"http:\\/\\/stackoverflow.com\\\",\"lang\":\"en\",\"timestamp_ms\":\"1565376937344\"}\r\n""{\"time\":\"Sat Aug 10 22:16:00 +0000 2019\", \"id\":721,\"text\":\"And I would appreciate your help!\",\"source\":\"href=\\\"http:\\/\\/stackoverflow.com\\\",\"lang\":\"en\",\"timestamp_ms\":\"156534564531\"}\r\n""{\"time\":\"Sun Aug 09 18:55:37 +0000 2019\", \"id\":720,\"text\":\"Imagine additional text repeating below.\",\"source\":\"href=\\\"http:\\/\\/stackoverflow.com\\\",\"lang\":\"en\",\"timestamp_ms\":\"1565376937344\"}\r\n"

Если вы назначите вышеуказанный текст объекту python и попросите python напечатать его, python вернет то, что я хочу увидеть , т.е.:

{"time":"Fri Aug 09 18:55:37 +0000 2019", "id":720,"text":"I'd really like to find a good solution to this problem.","source":"href=\"http:\/\/stackoverflow.com\","lang":"en","timestamp_ms":"1565376937344"}

{"time":"Sat Aug 10 22:16:00 +0000 2019", "id":721,"text":"And I would appreciate your help!","source":"href=\"http:\/\/stackoverflow.com\","lang":"en","timestamp_ms":"156534564531"}

{"time":"Sun Aug 09 18:55:37 +0000 2019", "id":720,"text":"Imagine additional text repeating below.","source":"href=\"http:\/\/stackoverflow.com\","lang":"en","timestamp_ms":"1565376937344"}

Но если я прочту файл в python объект и напечатаю этот объект, я получаю оригинальный текст. Я попытался f.read(), readline(), readlines(), splitlines() (что дало мне беспорядочный дополнительный беспорядок \\ s), и я попытался разбить строку, используя splitstring(). Я очень в растерянности, и я признаю, что я довольно плохо знаком с программированием и никогда не садился изучать основы.

Любая помощь, которую вы можете дать мне, чтобы взять приведенный выше текст и, в конечном счете, сможет перевести их в отдельный JSON объект и прочитать, скажем, тексты из каждого из них. Моя конечная цель - иметь возможность вызывать словарные ключи из отдельных json объектов, например:

for line in f:
    data = json.loads(line)
    print(data[‘text’])

и получать следующий список

"I'd really like to find a good solution to this problem."
"And I would appreciate your help!"
"Imagine additional text repeating below."

martineau · Answer 1 · 24 января 2020

Если я правильно понял проблему, использование literal_eval() может сделать то, что вам нужно:

from ast import literal_eval

with open('json_strings.txt') as file:
    for line in file:
        for line in literal_eval(line).splitlines():
            print(line)

Пример вывода:

{"time":"Fri Aug 09 18:55:37 +0000 2019", "id":720,"text":"I'd really like to find a good solution to this problem.","source":"href=\"http:\/\/stackoverflow.com\","lang":"en","timestamp_ms":"1565376937344"}
{"time":"Sat Aug 10 22:16:00 +0000 2019", "id":721,"text":"And I would appreciate your help!","source":"href=\"http:\/\/stackoverflow.com\","lang":"en","timestamp_ms":"156534564531"}
{"time":"Sun Aug 09 18:55:37 +0000 2019", "id":720,"text":"Imagine additional text repeating below.","source":"href=\"http:\/\/stackoverflow.com\","lang":"en","timestamp_ms":"1565376937344"}

Удаление \ r \ n из JSON строк в кавычках для получения нескольких строк

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Удаление \ r \ n из JSON строк в кавычках для получения нескольких строк

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы